OpenCV에서 입력과 출력에 사용되는 프록시 클래스이다. 다음과 같이 OutputArray는 InputArray를 상속 받아서 만들어진 객체이고, IunputOutputArray는 OutputArray를 상속 받아서 만들어진 객체이다. 때문이 이들 간에는 상속 관계에 의한 호환이 가능하다.
class CV_EXPORTS _InputArray {...}
class CV_EXPORTS _OutputArray : public _InputArray {...}
class CV_EXPORTS _InputOutputArray : public _OutputArray {...}
행렬을 표현하기 위한 용도로 단일 채널 또는 n차원의 채널을 나타낼 수 있다. Mat 클래스는 정수, 실수 또는 복소수 벡터 및 행렬, 회색조 또는 컬러 이미지, 복셀 볼륨, 벡터 필드, 포인트 클라우드, 텐서, 히스토그램을 저장하는데 사용된다.
재정의 이름 | 의미 | Depth_mask | 범위 |
CV_8U | unsigned char 8-bit unsigned integers | 0 | 0 ~ 255 |
CV_8S | signed char 8-bit signed integers | 1 | -128 ~ 127 |
CV_16U | unsigned short 16-bit unsigned integers | 2 | 0 ~ 65535 |
CV_16S | signed short 16-bit signed integers | 3 | -32768 ~ 32767 |
CV_32S | int 32-bit signed integers | 4 | -2147483648 |
CV_32F | float 32-bit floating-point numbers | 5 | -FLT_MAX ~ FLT_MAX, INF, NAN |
CV_64F | double 64-bit floating-point numbers | 6 | -DBL_MAX ~ DBL_MAX, INF, NAN |
CV_16F | float16 16-bit floating-point numbers | 7 | -OpenCV 4부터 지원 / 정보 없음 |
Mat class는 다양한 생성자와 초기화 방법이 구현되어 있다. 가장 먼저 빈 객체를 생성하는 방법이다. 카메라로 부터 받을 데이터를 저장하는 용도로 사용될 수 있다.
Mat img1;
// empty matrix
다음 방법은 행렬의 크기와 저장할 데이터의 타입을 지정하여 객체를 생성하는 방법이다. 정수 타입의 인자로 Mat 객체를 생성하는 경우 height, width 순서대로 넣어주어야 한다.
Mat img2(480, 640, CV_8UC1);
// unsigned char, 1-channel
Mat img3(480, 640, CV_8UC3);
// unsigned char, 3-channels
정수 형태의 인자 대신 Size()
객체를 이용해서 초기화가 가능하다. Size()
는 영상 또는 사각형의 크기를 정의위해 사용되는 템플릿 클래스이다. 이때 위 방법과 달리 width
, height
순으로 입력할 수 있다.
Mat img4(Size(640, 480), CV_8UC3);
// Size(width, height)
먼저 생성과 동시에 데이터를 초기화 하는 방법이다. Scalar()는 크기 4의 double 타입의 배열을 가지고 있는 클래스이다. 각각 영상의 색을 나타내는 B G R A을 저장하며, 배열과 마찬가지로 []
연산자를 통해 데이터에 접근이 가능하다.
Mat img5(480, 640, CV_8UC1, Scalar(128));
// initial values, 128
Mat img6(480, 640, CV_8UC3, Scalar(0, 0, 255));
// initial values, red
Mat mat5 = (Mat_<float>(2, 3) << 1, 2, 3, 4, 5, 6);
Mat mat6 = Mat_<uchar>({2, 3}, {1, 2, 3, 4, 5, 6});
Mat의 멤버 함수를 이용한 초기화 방법이다. zeros, ones, eye는 각각 행렬 전체를 0이나 1로 혹은 단위 행렬 형태로 초기화 하는 기능을 수행한다.
Mat mat1 = Mat::zeros(3, 3, CV_32SC1);
// 0's matrix
Mat mat2 = Mat::ones(3, 3, CV_32FC1);
// 1's matrix
Mat mat3 = Mat::eye(3, 3, CV_32FC1);
// identity matrix
이미 생성된 객체에 데이터를 추가하거나, 다른 크기, 데이터 타입의 형태로 변수를 초기화하는 방법이다.
mat4.create(256, 256, CV_8UC3); // uchar, 3-channels
mat5.create(4, 4, CV_32FC1); // float, 1-channel
mat4 = Scalar(255, 0, 0);
마지막으로 1차원 배열을 통해 데이터를 초기화 할 수 있다. 다만 행렬 전체 크기와 배열의 크기가 일치해야 한다.
float data[] = {1, 2, 3, 4, 5, 6};
Mat mat4(2, 3, CV_32FC1, data);
//! Matlab-style matrix initialization
Mat::zeros(int rows, int cols, int type, UMatUsageFlags usageFlags /*= USAGE_DEFAULT*/);
Mat::zeros(Size size, int type, UMatUsageFlags usageFlags /*= USAGE_DEFAULT*/);
Mat::zeros(int ndims, const int* sz, int type, UMatUsageFlags usageFlags /*= USAGE_DEFAULT*/);
Mat::zeros(int rows, int cols, int type) { return zeros(rows, cols, type, USAGE_DEFAULT); } // OpenCV 5.0: remove abi compatibility overload
Mat::zeros(Size size, int type) { return zeros(size, type, USAGE_DEFAULT); } // OpenCV 5.0: remove abi compatibility overload
Mat::zeros(int ndims, const int* sz, int type) { return zeros(ndims, sz, type, USAGE_DEFAULT); } // OpenCV 5.0: remove abi compatibility overload
Mat::ones(int rows, int cols, int type, UMatUsageFlags usageFlags /*= USAGE_DEFAULT*/);
Mat::ones(Size size, int type, UMatUsageFlags usageFlags /*= USAGE_DEFAULT*/);
Mat::ones(int ndims, const int* sz, int type, UMatUsageFlags usageFlags /*= USAGE_DEFAULT*/);
Mat::ones(int rows, int cols, int type) { return ones(rows, cols, type, USAGE_DEFAULT); } // OpenCV 5.0: remove abi compatibility overload
Mat::ones(Size size, int type) { return ones(size, type, USAGE_DEFAULT); } // OpenCV 5.0: remove abi compatibility overload
Mat::ones(int ndims, const int* sz, int type) { return ones(ndims, sz, type, USAGE_DEFAULT); } // OpenCV 5.0: remove abi compatibility overload
Mat::eye(int rows, int cols, int type, UMatUsageFlags usageFlags /*= USAGE_DEFAULT*/);
Mat::eye(Size size, int type, UMatUsageFlags usageFlags /*= USAGE_DEFAULT*/);
Mat::eye(int rows, int cols, int type) { return eye(rows, cols, type, USAGE_DEFAULT); } // OpenCV 5.0: remove abi compatibility overload
Mat::eye(Size size, int type) { return eye(size, type, USAGE_DEFAULT); } // OpenCV 5.0: remove abi compatibility overload
cout << mat.depth() << endl;
// 행렬의 원소의 자료형을 반환하는 매크로 상수이다.
// 8:1byte, U: unsigned, S: signed
// #define CV_8U 0
// #define CV_8S 1
// #define CV_16U 2
// #define CV_16S 3
// #define CV_32S 4
// #define CV_32F 5
// #define CV_64F 6
// #define CV_16F 7
cout << mat.channels() << endl;
// 이미지의 채널 수를 출력하는 매크로 상수이다.
// 흑백의 경우 1채널, 컬러 영상의 경우 3채널이다.
cout << mat.type() << endl;
// 행렬의 깊이와 채널을 한 번에 출력하는 매크로 상수이다.
벡터(vector)는 같은 동일한 타입의 데이터를 여러개 묶어놓은 형태로 저장하는 클래스이다. []
에 대한 연산자 오버로딩을 지원하기 때문에 행렬과 동일하게 데이터 원소 접근이 가능하다. 또한 <<
연사자를 오버로딩 하고 있기 때문에 std::cout을 통해 출력이 가능하다.
template<typename _Tp, int cn> class Vec : public Matx<_Tp, cn, 1>
//! default constructor
Vec(_Tp v0); //!< 1-element vector constructor
Vec(_Tp v0, _Tp v1); //!< 2-element vector constructor
Vec(_Tp v0, _Tp v1, _Tp v2); //!< 3-element vector constructor
Vec(_Tp v0, _Tp v1, _Tp v2, _Tp v3); //!< 4-element vector constructor
Vec(_Tp v0, _Tp v1, _Tp v2, _Tp v3, _Tp v4); //!< 5-element vector constructor
Vec(_Tp v0, _Tp v1, _Tp v2, _Tp v3, _Tp v4, _Tp v5); //!< 6-element vector constructor
Vec(_Tp v0, _Tp v1, _Tp v2, _Tp v3, _Tp v4, _Tp v5, _Tp v6); //!< 7-element vector constructor
Vec(_Tp v0, _Tp v1, _Tp v2, _Tp v3, _Tp v4, _Tp v5, _Tp v6, _Tp v7); //!< 8-element vector constructor
Vec(_Tp v0, _Tp v1, _Tp v2, _Tp v3, _Tp v4, _Tp v5, _Tp v6, _Tp v7, _Tp v8); //!< 9-element vector constructor
Vec(_Tp v0, _Tp v1, _Tp v2, _Tp v3, _Tp v4, _Tp v5, _Tp v6, _Tp v7, _Tp v8, _Tp v9); //!< 10-element vector constructor
Vec(_Tp v0, _Tp v1, _Tp v2, _Tp v3, _Tp v4, _Tp v5, _Tp v6, _Tp v7, _Tp v8, _Tp v9, _Tp v10, _Tp v11, _Tp v12, _Tp v13); //!< 14-element vector constructor
explicit Vec(const _Tp* values);
//! per-element multiplication
Vec mul(const Vec<_Tp, cn>& v) const;
//! conjugation (makes sense for complex numbers and quaternions)
Vec conj() const;
cross product of the two 3D vectors.
For other dimensionalities the exception is raised
Vec cross(const Vec& v) const;
//! conversion to another data type
template<typename T2> operator Vec<T2, cn>() const;
/*! element access */
const _Tp& operator [](int i) const;
_Tp& operator[](int i);
const _Tp& operator ()(int i) const;
_Tp& operator ()(int i);
자주 사용되는 Vec
클래스의 경우 Vec2(데이터의 수)b(데이터 타입)
으로 사용할 수 있도록 정의되어 있다.
typedef Vec<uchar, 2> Vec2b;
typedef Vec<uchar, 3> Vec3b;
typedef Vec<uchar, 4> Vec4b;
typedef Vec<short, 2> Vec2s;
typedef Vec<short, 3> Vec3s;
typedef Vec<short, 4> Vec4s;
typedef Vec<ushort, 2> Vec2w;
typedef Vec<ushort, 3> Vec3w;
typedef Vec<ushort, 4> Vec4w;
typedef Vec<int, 2> Vec2i;
typedef Vec<int, 3> Vec3i;
typedef Vec<int, 4> Vec4i;
typedef Vec<int, 6> Vec6i;
typedef Vec<int, 8> Vec8i;
typedef Vec<float, 2> Vec2f;
typedef Vec<float, 3> Vec3f;
typedef Vec<float, 4> Vec4f;
typedef Vec<float, 6> Vec6f;
typedef Vec<double, 2> Vec2d;
typedef Vec<double, 3> Vec3d;
typedef Vec<double, 4> Vec4d;
typedef Vec<double, 6> Vec6d;
크기가 4인 double
타입의 배열을 멤버 변수로 가지고 있는 클래스이다. 4채널 이하의 영상 데이터의 한 픽셀을 표현하는데 사용된다. []
연사자를 오버로딩 하고있어 행렬과 동일한 방법으로 데이터 원소 접근이 가능하다.
template<typename _Tp> class Scalar_ : public Vec<_Tp, 4>
//! default constructor
Scalar_(_Tp v0, _Tp v1, _Tp v2=0, _Tp v3=0);
Scalar_(_Tp v0);
Scalar_(const Scalar_& s);
Scalar_(Scalar_&& s) CV_NOEXCEPT;
Scalar_& operator=(const Scalar_& s);
Scalar_& operator=(Scalar_&& s) CV_NOEXCEPT;
template<typename _Tp2, int cn>
Scalar_(const Vec<_Tp2, cn>& v);
//! returns a scalar with all elements set to v0
static Scalar_<_Tp> all(_Tp v0);
//! conversion to another data type
template<typename T2> operator Scalar_<T2>() const;
//! per-element product
Scalar_<_Tp> mul(const Scalar_<_Tp>& a, double scale=1 ) const;
//! returns (v0, -v1, -v2, -v3)
Scalar_<_Tp> conj() const;
//! returns true iff v1 == v2 == v3 == 0
bool isReal() const;
기본적으로 double
데이터 타입으로 정의되어 있다.
typedef Scalar_<double> Scalar;
{: .note } mask
인자의 경우 0 이 아닌 위치의 데이터 원소들만 연산에 사용한다.
행렬의 합을 구하는 함수이다. Scalar 데이터 타입의 각 채널에 대한 행렬의 합을 반환한다.
Scalar sum(InputArray src);
평균을 구하는 함수이다. sum
함수와 마찬가지로 각 채널에 대한 평균을 Scalar
형태의 데이터 타입을 반환한다.
Scalar mean(InputArray src, InputArray mask = noArray());
void minMaxLoc(InputArray src, CV_OUT double* minVal,
CV_OUT double* maxVal = 0, CV_OUT Point* minLoc = 0,
CV_OUT Point* maxLoc = 0, InputArray mask = noArray());
void GpuMat::convertTo(OutputArray dst, int rtype, double alpha, double beta) const
convertTo(dst, rtype, alpha, beta, Stream::Null());
void normalize( InputArray src, InputOutputArray dst, double alpha = 1, double beta = 0,
int norm_type = NORM_L2, int dtype = -1, InputArray mask = noArray());
enum NormTypes {
NORM_L1 = 2,
NORM_L2 = 4,
NORM_TYPE_MASK = 7, //!< bit-mask which can be used to separate norm type from norm flags
NORM_RELATIVE = 8, //!< flag
NORM_MINMAX = 32 //!< flag
void ex_ops(){
uchar data[] = {1,2,3,4,5,6};
Mat mat(2,3, CV_8UC1, data);
cout << mat << endl;
int ret_sum = (int)sum(mat)[0];
cout << ret_sum << endl;
double ret_mean = (double)mean(mat)[0];
cout << ret_mean << endl;
double minval, maxval;
Point minloc, maxloc;
minMaxLoc(mat, &minval, &maxval, &minloc, &maxloc);
cout << format("%f %f (%d, %d) (%d, %d)",
minval, maxval,
minloc.x, minloc.y,
maxloc.x, maxloc.y) << endl;
Mat cvt_mat;
mat.convertTo(cvt_mat, CV_32FC1, 0.1, -5);
cout << cvt_mat << endl;
uchar maks_data[] = {1,1,1,1,1,0};
Mat mask(2,3, CV_8UC1, maks_data);
cout << mask << endl;
Mat norm_mat;
normalize(mat, norm_mat, 0, 1, NORM_MINMAX, CV_32FC1, mask);
cout << norm_mat << endl;
[ 1, 2, 3;
4, 5, 6]
1.000000 6.000000 (0, 0) (2, 1)
[-4.9000001, -4.8000002, -4.6999998;
-4.5999999, -4.5, -4.4000001]
[ 1, 1, 1;
1, 1, 0]
[0, 0.25, 0.5;
0.75, 1, 0]
2차원 점의 좌표를 표현하기 위한 템플릿 클래스이다. 좌표를 나타내는 x와 y 두 멤버 변수를 가지고 있다. 또한 내적을 구하는 dot()
함수, double 타입의 내적을 구하는 ddot()
함수, 외적을 구하는 cross()
, 사격형의 겹치는 부분이 있는지를 확인하는 inside()
로 4개의 멤버 함수로 구성된다.
template<typename _Tp> class Point_
Point_(_Tp _x, _Tp _y);
_Tp dot(const Point_& pt) const;
//! dot product computed in double-precision arithmetics
double ddot(const Point_& pt) const;
//! cross-product
double cross(const Point_& pt) const;
//! checks whether the point is inside the specified rectangle
bool inside(const Rect_<_Tp>& r) const;
_Tp x; //!< x coordinate of the point
_Tp y; //!< y coordinate of the point
자주 사용되는 데이터 타입에 대해서 아래와 같이 정의되어 있어 이를 사용해도 된다.
typedef Point_<int> Point2i;
typedef Point_<int64> Point2l;
typedef Point_<float> Point2f;
typedef Point_<double> Point2d;
typedef Point2i Point;
다양한 사칙 연산에 대한 연산자 오버로딩과 std::cout 출력을 위한 << 연산자 오버로딩을 지원한다.
pt1 = pt2 + pt3;
pt1 = pt2 - pt3;
pt1 = pt2 * a;
pt1 = a * pt2;
pt1 = pt2 / a;
pt1 += pt2;
pt1 -= pt2;
pt1 *= a;
pt1 /= a;
double value = norm(pt); // L2 norm
pt1 == pt2;
pt1 != pt2;
영상 또는 사각형의 크기를 표현하기 위한 템플릿 클래스이다. width
, height
두 멤버 변수를 가지고 있으며, 면적을 구하는 area()
함수가 구현되어 있다.
template<typename _Tp> class Size_
typedef _Tp value_type;
//! default constructor
Size_(_Tp _width, _Tp _height);
_Tp area() const;
//! aspect ratio (width/height)
double aspectRatio() const;
//! true if empty
bool empty() const;
//! conversion of another data type.
template<typename _Tp2> operator Size_<_Tp2>() const;
_Tp width; //!< the width
_Tp height; //!< the height
클래스와 마찬가지로 사칙 연사에 대한 오버로딩과 <<
연산자에 대한 오버로딩을 지원한다.
또한 자주 사용되는 데이터 타입에 대해서 다음과 같이 정의되어 있다.
typedef Size_<int> Size2i;
typedef Size_<int64> Size2l;
typedef Size_<float> Size2f;
typedef Size_<double> Size2d;
typedef Size2i Size;
2차원의 사각형 표현을 위함 템플릿 클래스이다. 좌상단과 넓이와 높이를 가지고 정의되며, x
, y
, width
, height
멤버 변수를 가지고 있다. 또한 사각형의 좌상단, 우하단을 반환하는 tl()
, br()
, 점이 사각형 안에 존재하는지를 확인해 주는 contains()
멤버 함수가 정의되어 있다.
template<typename _Tp> class Rect_
typedef _Tp value_type;
//! default constructor
Rect_(_Tp _x, _Tp _y, _Tp _width, _Tp _height);
//! the top-left corner
Point_<_Tp> tl() const;
//! the bottom-right corner
Point_<_Tp> br() const;
//! size (width, height) of the rectangle
Size_<_Tp> size() const;
//! area (width*height) of the rectangle
_Tp area() const;
//! true if empty
bool empty() const;
//! conversion to another data type
template<typename _Tp2> operator Rect_<_Tp2>() const;
//! checks whether the rectangle contains the point
bool contains(const Point_<_Tp>& pt) const;
_Tp x; //!< x coordinate of the top-left corner
_Tp y; //!< y coordinate of the top-left corner
_Tp width; //!< width of the rectangle
_Tp height; //!< height of the rectangle
자주 사용되는 데이터 타입에 대해서 다음과 같이 정의되어 있다.
typedef Rect_<int> Rect2i;
typedef Rect_<float> Rect2f;
typedef Rect_<double> Rect2d;
typedef Rect2i Rect;
Rect 객체와 Size
, Point
객체의 덧셈과 뺼셈, Rect 객체 간의 논리 연산을 지원한다.
Rect rc1; // [0 x 0 from (0, 0)]
Rect rc2(10, 10 60, 40); // [60 x 40 from (10, 10)]
Rect rc3 = rc1 + Size(50, 40); // [50 x 40 from (0, 0)]
Rect rc4 = rc2 + Point(10, 10); // [60 x 40 from (20, 20)]
Rect rc5 = rc3 & rc4; // [30 x 20 from (20, 20)]
Rect rc6 = rc3 | rc4; // [80 x 60 from (0, 0)]
정수 데이터 타입의 범위를 나타내는 클래스이다. 시작과 끝을 나타내는 두 멤버 변수를 가지고 있으며, 이때 시작은 범위에 포함되고 끝은 포함되지 않는다(e.g.(시작:끝])
class CV_EXPORTS Range
Range(int _start, int _end);
int size() const;
bool empty() const;
static Range all();
int start, end;