이 블로그 검색

2020년 10월 19일 월요일

frei0r - 오픈소스 이미지 콤포지션(트랜지션) 상세설명.(1) - Mixer2 Part1 alpha...

    Frei0r

    Frei0r은 Natron이나 kdenlive같은 비디오 에디터에서 사용되는 composition,transition, merge 툴이다. 

    adobe의 트랙 매트 (track matte)효과를 kdenlive에서 어떻게 구현할지를 생각하다가 이것으로 구현할 수 있을 것 같아 찾다가, 너무 이름이 직관적이지 않아 쓸 때마다 헛갈릴 것 같아 정리를 해놓는다. 



    Mixer2 

    Mixer2는 8비트 unsigned int형의 자료를 사용하여 각 픽셀의 색상정보를 저장한다. Mixer3을 봐야 알겠지만, 더 큰 자료형을 사용하는 부분이 구현이 되어있지 않다면, frei0r은 사용하지 않는 것이 좋을 것이다.  

    코드 호출이 어떻게 되는지를 몰라서, 일단은 A를 윗 레이어, B를 아래 레이어로 생각하고 글을 쓴다.    kdenlive에 넣어서 테스트 해보니, A가 아래 B가 위로였다. natron에서는 다를 수 있으므로 1번 2번으로 전부 다시 고쳤다. 

     
    •  ᅟAddition (더하기)
    더하기 효과는 간단하다. 윗 이미지와 아래 이미지의 rgb값을 더 한다. 최대 값은 255로 한다. 

    알파의 값은 두 알파의 최소 값으로 한다. 

    고로 항등 image에 해당하는 윗 이미지는 (0,0,0,255)로 이루어진 이미지이다. 

    2번 레이어의 알파는 min연산이다보니, 중간 값을 이용하기 보다는, 이진의 마스크 효과를 사용할 수 있고, 윗 레이어를 통해 닷지 효과처럼 사용한다.  

    그리고 중요한 점 중 하나는, 윗레이어(마스크)와 아래레이어(배경)의 교환 법칙이 성립한다는 것이다. 많은 효과들이 교환 법칙이 성립하지만, 아닌 것들도 많다. gimp의 이미지 합성 툴 가운데에도 그런 것이 있다. 

    그룹레이어를 사용하지 못하는 경우에 교환 법칙이 성립하는 것을 유용하게 사용할 수 있고, (서로는 순서가 상관 없지만 그 각각도 위아래가 따로 있으므로 )노드 방식의 이미지 에디터에서 연결순서가 바뀌어도 같은 경과가 나오기에 유용하다. 이제 아래부터는 그냥 교환법칙이 성립한다로 끝내도록 한다. 


    • Addition_alpha (알파더하기)
    Addition_alpha는 대표적인 잘못이름지어진 콤포지션 효과이다. 
    이름만 들으면, 마스크의 알파 값이 더해질 것 같은 이름이지만 전혀 다른 효과를 가진다. 

    1번의 rgb에다가  pre-multiplied RGB(이하 pRGB) 값을 더하는 효과이며,
    결과값은 완전 불투명이다. 

    마치 이미지 에디터에서의 더하기라고 생각하면 된다. 레이어를 투명하게도 하지만, 브러쉬 툴의 알파를 이용해서 여러번 덧칠한다거나 하는 느낌을 주지 않을까??

    • Alphaatop( alpha atop)

    매우 복잡하다. 

    일단, 결과값의 알파는 2번의 알파와 같다. 

    결과의 알파가 0이라면, 리소스 낭비를 줄이기 위해 모든 결과값을 0으로 한다. 이후에도 알파값을 먼저 계산하면 다 그러해서 설명하지 않는다. 

    0이 아닐 때는,  다음과 같은 계산을 거친다. 

    w1 = alpha2

    w2 = 255 - alpha1

    rgb_dst = [(prgb1 * w1 ) + (prgb2*w2)]/ alpha_dst

    rgb_dst = rgb1*alpha1 + rgb2* [(1-alpha1)]

    직관적으로 이해하기 어렵다. 

    2번의 알파값이 그대로 작동하므로 알파마스크처럼 사용되며, 

    1번의 알파값에 따라, 1,2번의 색상의 rgb 사잇값을 사용한다. 

    • alphain 

    결과값의 알파는 1,2번 알파의 곱이다.  

    결과값의 RGB는 1번의 RGB값을 결과값의 RGB값으로 하도록 되어 있다. 

    rgb_dst = (rgb1*alpha1/255) * alpha2 / alpha_dst
    그렇다면 prgb_dst = rgb1*alpha1*alpha2가 될 것이다. 
    막상 약분이 된다고 하면, 
    rgb_dst = rgb1이다. 약간의 차이는 uint8 연산이다보니 여기저기서 계단 현상이 일어난다. 이것이 중요한 부분일지는 모르겠다. 

    어쨌든 대충 alpha_dst= alpha1*alpha2 
                      rgb_dst ≃ rgb1

    최신 깔끔한 구현에는 그냥 두번째 알파채널 또는, 레이어마스크 처럼 작동하지 않을까?

    단순한 알파마스크로 색상은 아무변화를 주지 못하며, 흰색일수록 불투명하다. 

    • alphainjection (오래된 api라 1,2번이 다를 수 있음)
    1번의 rgb값의 평균값을 결과값의 알파값으로, 2번의 rgb를 그대로 사용한다. 

    fill/key로 분리해서 전송하는것과 같다고 보면 된다. 

    물론 rgb의 평균값이 yuv채널의 y값과 다르기 때문에 생각한 것과는 다를 수 있다. 

    matte의 경우에는 루마 값을 알파값으로 사용한다. (kdenlive) 
    (matte는 frei0r이 아니다.  mlt framework sse!! code)

    alphainjection이 kdenlive에서는 없는 것처럼 보인다. 


    • alphaout
    alphaout은 alphain과 거의 같으나, 알파 대신 (255-alpha) 값을 사용한다. 반대로 작동한다. 시작효과를 끝에다가 붙인다면, 시작과 끝이 맞아서 아름답지 않을까?

    • alphaover
    무언가 수식만 봐도 미친 것 처럼 보인다. 편의상 0-1의 실수형 색상이라고 할 때, 결과값 알파는 다음과 같다. 

    alpha_dst = alpha1*alpha1 + alpha2*alpha2*(1-alpha1)
    alpha1과 alpha2의 제곱사이의 사잇값이다. 1번이 불투명할 때는, 약간의 변화를 2번의 알파가 주며, 알파2의 제곱이 알파1보다 작을 때는 오히려 더 투명하게 된다. 

    결과값 RGB는 다음과 같다.   

    rgb_dst= (rgb1 * alpha1 + pRGB2*(1-alpha1) )/ alpha_dst

    이건 써봐야 알 것 같기는 한데,  같은 수식을 그대로 적용한다. 

    1번에 있는 투명한 부분이 매우 밝게 강조 된다. 나누기 연산이 있으면 일단, 뭔가 특별한 상황에서만 써야지 결과값이 맛이 많이 간다. 



    • alphaxor
    alpha간 xor연산을 할 것 같지만 아니다. 또는 구현을 내가 몰라서일 수도 있다. (뭐 근데 xor연산을 다른 방법으로 하는건 좀 이상하다. 미치지 않고서는)

    결과값 alpha = alpha1*(1-alpha2)+ alpha2*(1-alpha1)
    모두 투명하거나 불투명하다면, 불투명하게, 
    하나만 투명할 때 투명하게 결과가 나온다. 

    비트 단위의 xor이 아닌 불투명도라는 정도에 대한 xor이다. 

    색상은 다음과 같다. 

    rgb_dst= (pRGB1 * (1-alpha2) + pRGB2* (1-alpha1) )/ alpha_dst

    pRGB에 대해 불투명한 레이어 쪽이 더 부각되도록 되어 있다. 

    교환 법칙이 성립한다.





    2020년 10월 5일 월요일

    남이 Natron으로 만든 Lower Third를 연습하다가 템플릿처럼 사용하는 방법을 알게 되었다.

     Natron은 node 기반 opensource vfx application이다. 

    vfx 및 드로잉 툴들은 어느정도 발전이 되었다면, node기반 또는 레이어 기반의 형태로 나아간다. 

    Node기반 툴들은 Davinci resolve,(NLE) Blackmagic Fusion(VFX)이라는 걸출한 유료프로그램이 있고, Blender라는 NLE, 3D modeling, Node vfx를 지원하는 툴도 있다. 

    Natron은 무료이며 일단 openfx기반이라 다양한 행위를 할 수 있다고 하는데, 그게 무슨 장점인지는 모르겠다.  

    Natron은 일단 Fusion이라는 툴을 써본 결과로 말하자면, 아무것도 배우지 않은 백지 상태에서는 차이를 알 수 없다.  왜냐 ... Layer기반을 쓰다가 이걸 처음 만지면, 어떻게 하는지 알수가 없기에... 그러하다.  뇌에서 Layer가 아닌 모든 것들이 다 공통으로 묶인 것으로 여겨진다. 

    Natron Youtube Lower third 강좌를 따라해보니, Natron은 결과물 출력으로 단일영상 또는 이미지시퀀스로  처리한다.  

    여기까지 따라하니, 내 이름을 특정 Text대신 쓰고난 이후에, 

    다양한 상황에서 쓰기 어렵다는 생각이 들어, 템플릿으로 쓸 방법을 찾는다. 

    일단 Natron Project파일은 xml기반이라, 노가다를 하고, nodejs를 사용하면, 텍스트 기반이니 당연히 가능하다.  

    일단 여러 검색을 해보니, Natron을 터미널에서 사용해, 출력물을 얻는 방법이 있음을 알게 되었다. 

    외부 툴을 사용하지 않고, Natron만 가지고 이것을 하고 싶다. xml은 구조화는 잘되어 있지만 인간이 접근하기 좋은 규격은 아니다. 

    Natron은 python script를 사용할 수 있고, 잘못검색을 하면, python을 프로젝트 파일처럼 사용하는 부분만 보게된다. 


    좀 더 신경을 쓰면, 프로젝트파일을 불러오고, onload시 python을 불러오는 옵션이 있다.

    -b는 터미널에서  바로 출력물을 얻겠다. 

    -l(L이다. ) 이 해당하는 python 스크립트이다. 

    natron -b Natron.project.ntp -l python1.py 

    이 두 명령으로 python1실행으로 내부가 변한 상태의 출력물을 얻을 수 있다. 

    저 python1.py의 구조가 이제 중요하다. 


    내부 노드에 어떻게 접근을 할 수 있을까?

    Natron은 일단 프로젝트 파일을 불러온 후 프로젝트 xml을 잘 정리해서 app1이라는 클래스에 모든 정보를 넣는다. 그리고 노드이름으로 간단히 접근할 수 있다. 

     1  
     2 node = app1.Text1
     3  
     4 node.text.set("hello World")

    내 경우는 위 처럼 2줄짜리 프로그램으로 글자를 바꿀 수 있게 된다. 

    뭐 더 고친다면 소속까지 한 줄 더 작성하는 정도이겠다. 

    자이제 natron 명령으로 여러명의 개인 소개용 Lower Third를 만들도록하자. 

    bash까지 사용하면 못할게 없고, sed 명령어를 사용해 쉽게 작업할 수 있다. 

    (sed를 사용하면, 애초에 매우 쉽다. )


    자료리스트

    konkuk으로 시작하는 친구들은, writer까지 작업이 되어있어서 편리하다. 원본이랑 사실 별차이 없다. 

    300프레임에 25MB정도씩 나와서 생각보다 무겁지만 재미있는 작업이 될 것이다. 

    csv파일로 로고파일주소, Text1 내용  Text_2 내용 등을 만들어 놓으면, 여러사람에 대해 설명하는 작업을 해서 재미있게 할 수 있을 것이다. 


    열심히 썼지만, 문제가 있는데, Natron은 저 움직이는 이미지 작업 자체가 더럽다. 뭐... 개인적으로 3D Text의 두깨 기능이 지원이 안되서, 배우는건 Natron으로 하고, 실지로는 Blender를 쓰지 않을까... 


    돈있으면, after effect용 템플릿을 구하면 된다. 


    이 글에서 가장 중요한건, app1이라는 클래스 이름이다. 

    우분투 리눅스에서 모니터 오버클락하기.

     

    리눅스에서 디스플레이 해상도 등과 관련된 패키지는 xrandr이다. 


    xrandr을 통해 다양한 display mode를 체험할 수 있다. 


    지금 현재 사용하고 있는, 모니터는 DELL 2312HM으로 홈페이지상 스펙으로는  1920x1080  60이 한계인 것으로 나타난다. 


    처음 xrandr을 누르면, 이 이하의 설정가능한 다양한 해상도 등이 나온다. 

    1080x1024 75.02 60 

    640x480 75 59.94 

    등이 나오는데, 이 값들은 일종의 디스플레이 업계의 약속된 추천해상도라고 할 수 있다. 


    윈도우 시스템의 경우는 드라이버에 따라서, 굉장히 다양한 해상도 설정이 가능한 경우가 있는데, 이 해상도들은, 일종의 업계 호환해상도라고 할 수 있다. 


    이 호환 해상도에 해당하는 것이 바로 gtf, cvt라는 것이다. (위키에 검색해보시오)


    여기에는 그래픽카드에서 모니터로 신호를 보낼 때, 어떤 주파수로 신호를 보내고, 어디서부터 어디까지인지 신호를 보낼지에 대한 일종의 약속이다. 이 신호는 결국 픽셀정보를 직렬로 보내다보니 직사각형의 화면정보를 열별로 나누어 보내게 되고,  어디부터 시작인지 어디가 끝인지, 열의 시작과 끝이 어디인지 및 몇가지 정보전달을 위한  위한 메타데이터를 필요로 하게되고 이러한 값들이 직사각형 정보덩어리의  테두리 여백으로 들어가게 된다. 

    기본 규약은 어차피 자동으로 처리가 되므로 필요한 것은 저 호환 해상도에 해당하는 gtf와 cvt이다. 

    리눅스의 경우 gtf를 누르면 다음처럼 나오고,

    원하는 해상도를 입력하면 다음처럼 나온다. 

    cvt의 경우도 마찬가지이다. 




    이렇게 얻은 정보를 가지고 xrandr를 사용하여 추가하여 사용할 수 있다. (싱글모니터는 요렇게하지만 듀얼부터는 몇자를 더적어야)

    Modeline 뒷 정보를 다음처럼,
    xrandr --newmode "1920x1080_60.00"  173.00  1920 2048 2248 2576  1080 1083 1088 1120 -hsync +vsync
    xrandr --addmode "1920x1080_60.00"

    xrandr --mode "1920x1080_60.00"



    이제부터 모니터 오버클럭이야기를 해보자. 


    원래부터 지원되는 해상도임에도 불구하고 저렇게 입력하면, dvi single link나(대부분 와이드 해상도 면... 맞아...) 오래된 hdmi 버전을 쓰는 모니터는 먹통이 된다.   저 첫번째 숫자부분이 165를 넘어가면 먹통이 된다. (내 테스트는 164도 먹통이었음 163.xx까지는 잘 되었음. 이 현상은 케이블 먹통이라 하자.) 

     당연히 약속이 잘되어 있는 친구들이, 메타데이터가 덜 필요하다. 약속만 되어 있으면, 봉화 몇개로도, 전쟁유무가 파악되는 법 ...  

    예비약속이다보니, 더 많은 정보가 필요하다.  


    이 예비약속들만으로는 되지 않는다. 윈도우 처럼 넘실거리는 수많은 모니터 해상도 지원은 가능하지만, 오버클럭은 불가능하다. 

    아날로그 시대에 비해 디지털 시대에 HD가 붙기 시작하는 친구들은 해상도가 더 큰 편이다보니, 메타데이터를 잘 접어서 구석에  넣는 방법이 생겼다. 

    (이 문장은 내 개인 추측이다. 틀렸을 수 있다. )

    그 방법을 cvt-rb 방식이라 한다. 

    https://en.wikipedia.org/wiki/Coordinated_Video_Timings#Reduced_blanking 

    우분투에서는 cvt-rb 방식을 apt로 받는 cvt에서 지원을 한다. 


    보면 알겠지만, 갑자기 165MHz까지 가기에는 많이 남게된다. 

    그런데 안타깝게도, 이 규약은 원래 나올 때, 60Hz의 배수만을 지원하기 위해 나왔다. (아마 표준 나오고 빠른 모니터가 너무 빨리 나왔을때 나온걸로 보인다)

    그러다보니 이툴은 60-120hz사이의 다른값들을 쓰기에 부적절하다. 뭐 구글에 linux monitor overclock이라 검색하면 수정된 cvt와 더 다르게 구겨넣는  방식인 cvt-rb2까지 지원하는 녀석이 깃헛에 있음을 알 수 있다. 

    wget http://www.uruk.org/~erich/projects/cvt/cvt.c

    $ curl https://raw.githubusercontent.com/kevinlekiller/cvt_modeline_calculator_12/master/cvt12.c --output cvt12.c

    Compilation:

    $ gcc cvt12.c -O2 -o cvt12 -lm -Wall

    앞 친구는 60hz 배수를 써야하는 규약을 무시하고 중간 친구들을 만들어주고, 뒷친구는 cvt-rb2까지 지원을 하는 친구인데 뒤에걸 일단 쓰는 걸로 하자. 뒤에 것은 c 옵션으로 강제조항이 있다. 

    그 방법을 통해 60까지 지원하는 h2312hm을 


    Modeline "1920x1080_73.86_rb2"  164.99 까지 올렸다. 

    일단 강제조항을 써서 얻은 cvt-rb는 dell이 나름 메인스트림 회사라 지원을 제대로 안한다. 이상한 회사라면 지원했을 수도 있어서 .. 75성공했을텐데... 


    일단 dvi-d sigle-link에서는 이 이상 올릴 수가 없다. 

    일단 저위에 그림처럼, 24라는 표준 깜빡임의 배수로 설정할 예정이다만, 저정도로 가득채워서 올릴 수 있다. 


    나중에 display port를 지원하는 그래픽카드가 있으면 좀 더 노력을 해보겠다. 


      이러한 방식으로 linux에서는 디스플레이 오버클럭을 한다. 

    모니터가 지원을 안하고 힘들어 할 수 있지만, 보통은 여유를 가지고 지원을 해주므로,  refresh 속도를  더 올려보자. 

    내 모니터는 75정도에서 한계점을 가진게 맞는지... 1280 720에서 여유가 많이 있음에도 120 90은 실패했다. 

    여러번의 시도를 거치면 적당한 해상도에서 최대 refresh값을 얻을 수 있지 않을까... 리눅스는 노가다다. 



    가장 많이 본 글