docs-v2/Vector_8hpp_source.html

#pragma once

#include <cstring>

#include "common.hpp"

#include <common.hpp>


namespace rack {


namespace simd {


template <typename TYPE, int SIZE>

struct Vector;


template <>


struct Vector<float, 4> {

    using type = float;

    constexpr static int size = 4;


    union {

        __m128 v;

        float s[4];

    };


    Vector() = default;


    Vector(__m128 v) : v(v) {}


    Vector(float x) {

        v = _mm_set1_ps(x);

    }


    Vector(float x1, float x2, float x3, float x4) {

        v = _mm_setr_ps(x1, x2, x3, x4);

    }


    static Vector zero() {

        return Vector(_mm_setzero_ps());

    }


    static Vector mask() {

        return Vector(_mm_castsi128_ps(_mm_cmpeq_epi32(_mm_setzero_si128(), _mm_setzero_si128())));

    }


    static Vector load(const float* x) {

        /*

        My benchmarks show that _mm_loadu_ps() performs equally as fast as _mm_load_ps() when data is actually aligned.

        This post seems to agree. https://stackoverflow.com/a/20265193/272642

        I therefore use _mm_loadu_ps() for generality, so you can load unaligned arrays using the same function (although load aligned arrays if you can for best performance).

        */

        return Vector(_mm_loadu_ps(x));

    }


    void store(float* x) {

        _mm_storeu_ps(x, v);

    }


    float& operator[](int i) {

        return s[i];

    }


    const float& operator[](int i) const {

        return s[i];

    }


    // Conversions

    Vector(Vector<int32_t, 4> a);

    // Casts

    static Vector cast(Vector<int32_t, 4> a);

};


template <>


struct Vector<int32_t, 4> {

    using type = int32_t;

    constexpr static int size = 4;


    union {

        __m128i v;

        int32_t s[4];

    };


    Vector() = default;

    Vector(__m128i v) : v(v) {}


    Vector(int32_t x) {

        v = _mm_set1_epi32(x);

    }


    Vector(int32_t x1, int32_t x2, int32_t x3, int32_t x4) {

        v = _mm_setr_epi32(x1, x2, x3, x4);

    }


    static Vector zero() {

        return Vector(_mm_setzero_si128());

    }


    static Vector mask() {

        return Vector(_mm_cmpeq_epi32(_mm_setzero_si128(), _mm_setzero_si128()));

    }


    static Vector load(const int32_t* x) {

        // HACK

        // Use _mm_loadu_si128() because GCC doesn't support _mm_loadu_si32()

        return Vector(_mm_loadu_si128((const __m128i*) x));

    }


    void store(int32_t* x) {

        // HACK

        // Use _mm_storeu_si128() because GCC doesn't support _mm_storeu_si32()

        _mm_storeu_si128((__m128i*) x, v);

    }


    int32_t& operator[](int i) {

        return s[i];

    }


    const int32_t& operator[](int i) const {

        return s[i];

    }


    Vector(Vector<float, 4> a);

    static Vector cast(Vector<float, 4> a);

};


// Conversions and casts


inline Vector<float, 4>::Vector(Vector<int32_t, 4> a) {

    v = _mm_cvtepi32_ps(a.v);

}


inline Vector<int32_t, 4>::Vector(Vector<float, 4> a) {

    v = _mm_cvttps_epi32(a.v);

}


inline Vector<float, 4> Vector<float, 4>::cast(Vector<int32_t, 4> a) {

    return Vector(_mm_castsi128_ps(a.v));

}


inline Vector<int32_t, 4> Vector<int32_t, 4>::cast(Vector<float, 4> a) {

    return Vector(_mm_castps_si128(a.v));

}


// Operator overloads


#define DECLARE_VECTOR_OPERATOR_INFIX(t, s, operator, func) \

    inline Vector<t, s> operator(const Vector<t, s>& a, const Vector<t, s>& b) { \

        return Vector<t, s>(func(a.v, b.v)); \

    }


#define DECLARE_VECTOR_OPERATOR_INCREMENT(t, s, operator, opfunc) \

    inline Vector<t, s>& operator(Vector<t, s>& a, const Vector<t, s>& b) { \

        return a = opfunc(a, b); \

    }


DECLARE_VECTOR_OPERATOR_INFIX(float, 4, operator+, _mm_add_ps)

DECLARE_VECTOR_OPERATOR_INFIX(int32_t, 4, operator+, _mm_add_epi32)


DECLARE_VECTOR_OPERATOR_INFIX(float, 4, operator-, _mm_sub_ps)

DECLARE_VECTOR_OPERATOR_INFIX(int32_t, 4, operator-, _mm_sub_epi32)


DECLARE_VECTOR_OPERATOR_INFIX(float, 4, operator*, _mm_mul_ps)

// DECLARE_VECTOR_OPERATOR_INFIX(int32_t, 4, operator*, NOT AVAILABLE IN SSE3)


DECLARE_VECTOR_OPERATOR_INFIX(float, 4, operator/, _mm_div_ps)

// DECLARE_VECTOR_OPERATOR_INFIX(int32_t, 4, operator/, NOT AVAILABLE IN SSE3)


/* Use these to apply logic, bit masks, and conditions to elements.

Boolean operators on vectors give 0x00000000 for false and 0xffffffff for true, for each vector element.


Examples:


Subtract 1 from value if greater than or equal to 1.


    x -= (x >= 1.f) & 1.f;

*/

DECLARE_VECTOR_OPERATOR_INFIX(float, 4, operator^, _mm_xor_ps)

DECLARE_VECTOR_OPERATOR_INFIX(int32_t, 4, operator^, _mm_xor_si128)


DECLARE_VECTOR_OPERATOR_INFIX(float, 4, operator&, _mm_and_ps)

DECLARE_VECTOR_OPERATOR_INFIX(int32_t, 4, operator&, _mm_and_si128)


DECLARE_VECTOR_OPERATOR_INFIX(float, 4, operator|, _mm_or_ps)

DECLARE_VECTOR_OPERATOR_INFIX(int32_t, 4, operator|, _mm_or_si128)


DECLARE_VECTOR_OPERATOR_INCREMENT(float, 4, operator+=, operator+)

DECLARE_VECTOR_OPERATOR_INCREMENT(int32_t, 4, operator+=, operator+)


DECLARE_VECTOR_OPERATOR_INCREMENT(float, 4, operator-=, operator-)

DECLARE_VECTOR_OPERATOR_INCREMENT(int32_t, 4, operator-=, operator-)


DECLARE_VECTOR_OPERATOR_INCREMENT(float, 4, operator*=, operator*)

// DECLARE_VECTOR_OPERATOR_INCREMENT(int32_t, 4, operator*=, NOT AVAILABLE IN SSE3)


DECLARE_VECTOR_OPERATOR_INCREMENT(float, 4, operator/=, operator/)

// DECLARE_VECTOR_OPERATOR_INCREMENT(int32_t, 4, operator/=, NOT AVAILABLE IN SSE3)


DECLARE_VECTOR_OPERATOR_INCREMENT(float, 4, operator^=, operator^)

DECLARE_VECTOR_OPERATOR_INCREMENT(int32_t, 4, operator^=, operator^)


DECLARE_VECTOR_OPERATOR_INCREMENT(float, 4, operator&=, operator&)

DECLARE_VECTOR_OPERATOR_INCREMENT(int32_t, 4, operator&=, operator&)


DECLARE_VECTOR_OPERATOR_INCREMENT(float, 4, operator|=, operator|)

DECLARE_VECTOR_OPERATOR_INCREMENT(int32_t, 4, operator|=, operator|)


DECLARE_VECTOR_OPERATOR_INFIX(float, 4, operator==, _mm_cmpeq_ps)

DECLARE_VECTOR_OPERATOR_INFIX(int32_t, 4, operator==, _mm_cmpeq_epi32)


DECLARE_VECTOR_OPERATOR_INFIX(float, 4, operator>=, _mm_cmpge_ps)


inline Vector<int32_t, 4> operator>=(const Vector<int32_t, 4>& a, const Vector<int32_t, 4>& b) {

    return Vector<int32_t, 4>(_mm_cmpgt_epi32(a.v, b.v)) ^ Vector<int32_t, 4>::mask();

}


DECLARE_VECTOR_OPERATOR_INFIX(float, 4, operator>, _mm_cmpgt_ps)

DECLARE_VECTOR_OPERATOR_INFIX(int32_t, 4, operator>, _mm_cmpgt_epi32)


DECLARE_VECTOR_OPERATOR_INFIX(float, 4, operator<=, _mm_cmple_ps)

inline Vector<int32_t, 4> operator<=(const Vector<int32_t, 4>& a, const Vector<int32_t, 4>& b) {

    return Vector<int32_t, 4>(_mm_cmplt_epi32(a.v, b.v)) ^ Vector<int32_t, 4>::mask();

}


DECLARE_VECTOR_OPERATOR_INFIX(float, 4, operator<, _mm_cmplt_ps)

DECLARE_VECTOR_OPERATOR_INFIX(int32_t, 4, operator<, _mm_cmplt_epi32)


DECLARE_VECTOR_OPERATOR_INFIX(float, 4, operator!=, _mm_cmpneq_ps)


inline Vector<int32_t, 4> operator!=(const Vector<int32_t, 4>& a, const Vector<int32_t, 4>& b) {

    return Vector<int32_t, 4>(_mm_cmpeq_epi32(a.v, b.v)) ^ Vector<int32_t, 4>::mask();

}


inline Vector<float, 4> operator+(const Vector<float, 4>& a) {

    return a;

}


inline Vector<int32_t, 4> operator+(const Vector<int32_t, 4>& a) {

    return a;

}


inline Vector<float, 4> operator-(const Vector<float, 4>& a) {

    return 0.f - a;

}


inline Vector<int32_t, 4> operator-(const Vector<int32_t, 4>& a) {

    return 0 - a;

}


inline Vector<float, 4>& operator++(Vector<float, 4>& a) {

    return a += 1.f;

}


inline Vector<int32_t, 4>& operator++(Vector<int32_t, 4>& a) {

    return a += 1;

}


inline Vector<float, 4>& operator--(Vector<float, 4>& a) {

    return a -= 1.f;

}


inline Vector<int32_t, 4>& operator--(Vector<int32_t, 4>& a) {

    return a -= 1;

}


inline Vector<float, 4> operator++(Vector<float, 4>& a, int) {

    Vector<float, 4> b = a;

    ++a;

    return b;

}


inline Vector<int32_t, 4> operator++(Vector<int32_t, 4>& a, int) {

    Vector<int32_t, 4> b = a;

    ++a;

    return b;

}


inline Vector<float, 4> operator--(Vector<float, 4>& a, int) {

    Vector<float, 4> b = a;

    --a;

    return b;

}


inline Vector<int32_t, 4> operator--(Vector<int32_t, 4>& a, int) {

    Vector<int32_t, 4> b = a;

    --a;

    return b;

}


inline Vector<float, 4> operator~(const Vector<float, 4>& a) {

    return a ^ Vector<float, 4>::mask();

}


inline Vector<int32_t, 4> operator~(const Vector<int32_t, 4>& a) {

    return a ^ Vector<int32_t, 4>::mask();

}


inline Vector<int32_t, 4> operator<<(const Vector<int32_t, 4>& a, const int& b) {

    return Vector<int32_t, 4>(_mm_sll_epi32(a.v, _mm_cvtsi32_si128(b)));

}


inline Vector<int32_t, 4> operator>>(const Vector<int32_t, 4>& a, const int& b) {

    return Vector<int32_t, 4>(_mm_srl_epi32(a.v, _mm_cvtsi32_si128(b)));

}


// Typedefs


using float_4 = Vector<float, 4>;

using int32_4 = Vector<int32_t, 4>;


} // namespace simd

} // namespace rack

DECLARE_VECTOR_OPERATOR_INFIX
#define DECLARE_VECTOR_OPERATOR_INFIX(t, s, operator,func)
a @ b
Definition Vector.hpp:176

DECLARE_VECTOR_OPERATOR_INCREMENT
#define DECLARE_VECTOR_OPERATOR_INCREMENT(t, s, operator,opfunc)
a @= b
Definition Vector.hpp:182

rack::simd::operator<=
Vector< int32_t, 4 > operator<=(const Vector< int32_t, 4 > &a, const Vector< int32_t, 4 > &b)
Definition Vector.hpp:250

rack::simd::operator>>
Vector< int32_t, 4 > operator>>(const Vector< int32_t, 4 > &a, const int &b)
a >> b
Definition Vector.hpp:332

rack::simd::operator<<
Vector< int32_t, 4 > operator<<(const Vector< int32_t, 4 > &a, const int &b)
a << b
Definition Vector.hpp:327

rack::simd::operator-
Vector< float, 4 > operator-(const Vector< float, 4 > &a)
-a
Definition Vector.hpp:271

rack::simd::operator++
Vector< float, 4 > & operator++(Vector< float, 4 > &a)
++a
Definition Vector.hpp:279

rack::simd::operator--
Vector< float, 4 > & operator--(Vector< float, 4 > &a)
--a
Definition Vector.hpp:287

rack::simd::operator~
Vector< float, 4 > operator~(const Vector< float, 4 > &a)
~a
Definition Vector.hpp:319

rack::simd::operator+
Vector< float, 4 > operator+(const Vector< float, 4 > &a)
+a
Definition Vector.hpp:263

rack
Root namespace for the Rack API.
Definition AudioDisplay.hpp:9

common.hpp

rack::simd::Vector< float, 4 >
Wrapper for __m128 representing an aligned vector of 4 single-precision float values.
Definition Vector.hpp:34

rack::simd::Vector< float, 4 >::mask
static Vector mask()
Returns a vector with all 1 bits.
Definition Vector.hpp:67

rack::simd::Vector< float, 4 >::store
void store(float *x)
Writes an array of 4 values.
Definition Vector.hpp:86

rack::simd::Vector< float, 4 >::Vector
Vector(float x1, float x2, float x3, float x4)
Constructs a vector from four scalars.
Definition Vector.hpp:57

rack::simd::Vector< float, 4 >::operator[]
float & operator[](int i)
Accessing vector elements individually is slow and defeats the purpose of vectorizing.
Definition Vector.hpp:93

rack::simd::Vector< float, 4 >::Vector
Vector(__m128 v)
Constructs a vector from a native __m128 type.
Definition Vector.hpp:49

rack::simd::Vector< float, 4 >::Vector
Vector(float x)
Constructs a vector with all elements set to x.
Definition Vector.hpp:52

rack::simd::Vector< float, 4 >::Vector
Vector()=default
Constructs an uninitialized vector.

rack::simd::Vector< float, 4 >::load
static Vector load(const float *x)
Reads an array of 4 values.
Definition Vector.hpp:74

rack::simd::Vector< float, 4 >::operator[]
const float & operator[](int i) const
Definition Vector.hpp:96

rack::simd::Vector< float, 4 >::type
float type
Definition Vector.hpp:35

rack::simd::Vector< float, 4 >::zero
static Vector zero()
Returns a vector with all 0 bits.
Definition Vector.hpp:62

rack::simd::Vector< float, 4 >::v
__m128 v
Definition Vector.hpp:39

rack::simd::Vector< int32_t, 4 >
Definition Vector.hpp:108

rack::simd::Vector< int32_t, 4 >::Vector
Vector(int32_t x1, int32_t x2, int32_t x3, int32_t x4)
Definition Vector.hpp:122

rack::simd::Vector< int32_t, 4 >::zero
static Vector zero()
Definition Vector.hpp:125

rack::simd::Vector< int32_t, 4 >::Vector
Vector(__m128i v)
Definition Vector.hpp:118

rack::simd::Vector< int32_t, 4 >::v
__m128i v
Definition Vector.hpp:113

rack::simd::Vector< int32_t, 4 >::Vector
Vector(int32_t x)
Definition Vector.hpp:119

rack::simd::Vector< int32_t, 4 >::Vector
Vector()=default

rack::simd::Vector< int32_t, 4 >::operator[]
const int32_t & operator[](int i) const
Definition Vector.hpp:144

rack::simd::Vector< int32_t, 4 >::type
int32_t type
Definition Vector.hpp:109

rack::simd::Vector< int32_t, 4 >::mask
static Vector mask()
Definition Vector.hpp:128

rack::simd::Vector< int32_t, 4 >::load
static Vector load(const int32_t *x)
Definition Vector.hpp:131

rack::simd::Vector< int32_t, 4 >::operator[]
int32_t & operator[](int i)
Definition Vector.hpp:141

rack::simd::Vector< int32_t, 4 >::store
void store(int32_t *x)
Definition Vector.hpp:136

rack::simd::Vector
Generic class for vector types.
Definition Vector.hpp:28