동영상 및 음성파일 자막생성 프로그램 BUZZ
현재 제일 좋은 자막생성 프로그램은 Whisper 이지만 그래픽카드(GPU) 가없는 사람이나 노트북 사용자에게는 그림에 떡이다.
그러던중 상대적으로 여유가 있는 CPU를 사용해서 자막생성은 불가능한가? 라는 생각이 들어서 검색을 하던중 BUZZ 라는 프로그램을 발견하였다.
Whisp 와 동일한 음성인식 모델을 사용 하기에 높은 인식률을 보여주며, 비용이 발생하거나 그래픽카드의 필요가 없어 사용이 용이하다. 제일중요한건 무료이다.
BUZZ다운로드<< 클릭하여 다운로드
다운로드 받은 파일을 클릭하여 설치를 진행 하면 아래 화면처럼 설치 윈도우 보호가 나타난다.
이때 추가정보 를 클릭하여 설치를 진행한다.
위 처럼 설치가 완료되었다면 BUZZ프로그램을 실행한다.
이제 HELP >>> Preferences 클릭하여 필요한 모델은 다운받도록한다.
모델 다운로드시 Medium 정도는 다운받아야 동영상이나 파일의 언어 인식률이 높은것 같다.
설치후 + 눌러서 파일을 추가하거나 드레그하여 파일을 추가할수 있으며 동영상 파일을 번역하기 전에 위에 같이 나온다.
[Task]: “Transcribe”는 오디오를 선택한 언어의 텍스트로 변환하고 “Translate”는 영어 텍스트로 번역하는 작업이다.
[Language]: 오디오 언어 선택. 자막을 생성할 파일이나 동영상의 사용하는 언어를 골라준다.
[Export As]: 저장 포맷 설정. 텍스트(TXT) 문서로 저장할지 srt 자막 형식으로 저장할지 결정할 수 있다.
작업이 완료되면 Completed 라는 표시가 나오면서 영상의 시간이 표기된다.
뉴스 동영상의 자막 생성 파일을 돌려본결과 생각보다 좋은 수준의 결과가 나왔다.
100 % 완벽한게 아니라 반일>> 바닐 이라고 자막이 생성되엇지만 그외에는 비교적 정확한 자막이 생성된것을 볼수 있다.
비교적 한국어가 정확학 나오는이유는 작년에 발표한 내용을 보니 이해가 되었다.
680,000시간을 사용하여 학습한 모델을 공개 한 내용중 사용된 데이터의 양을 보면 아래 그림과 같이 다양한 언어를 학습을 시켰는데요. 그중에 특히 한국어가 약 8,000시간, 영어 제외 언어로는 7번째 많은 양의 데이터를 학습을 한것을 볼수 있다.
지금까지 사용해본결과 가장 좋은 사용용도 아래와 같이 추천드립니다.