음성 파일을 업로드하면 텍스트로 변환해주는 기능을 만드려고 한다.
클로바 노트같은 유료서비스들이 있지만 만들어보기로 했다. (이런걸 지나치지 못하고)
찾아보니 open ai 에서 공개한 오픈소스인 whisper API 를 사용하면 변환이 매끄럽게 가능하다는 것을 알게 되었다.
하지만 이 API 를 사용하기 위한 방법으로는 크게 세가지가 있었다.
1) 로컬 컴퓨터에 다운받아 사용 : GPU 10기가 이상 필요
2) 구글 코랩 이용 : 무료지만 12시간 이후 세션이 끊김
3) API 사용 : 비용 발생
두번째 방법인 구글 코랩을 사용해보려고 한다
구글 코랩은 웹브라우저에서 실행하는 가상의 컴퓨터 기반의 파이썬 실행 환경이다.
설치 없이 구글 드라이브처럼 쓰면 되고, 무료로 GPU까지 제공해줘서 머신러닝, 데이터 처리, AI 쓸 때 편리하다는 장점이 있다.
1. 구글 드라이브에서 My Drive > test 폴더에서 오른쪽 우클릭 후 > Open with > Connect more apps
2. colab 검색 > Colaboratory 설치
3. settings > Manage apps > Google Colaboratory 디폴트 옵션 선택 되어있는지 확인하기
4. Drive 로 돌아와서 마우스 우클릭 > More > Google Colaboratory 클릭
5. Colab 페이지로 접근했다. Tools > Settings > Site 에서 설정을 확인해주자
요정도로 설정해주고 마무으리
6. Runtime > Change Runtime Type 으로 들어가서 Python 3 과 T4 GPU 를 선택해주고 저장!
이렇게 기본세팅을 끝마쳤다! 이제는 whisper api 를 사용하러 가보자~
Google Colab - 음성파일 텍스트로 변환하기 (Feat. Whisper)
음성 파일을 업로드하여 텍스트로 변환하는 프로그램을 만드는 중이다지난 시간에는 코랩을 세팅하는 포스팅을 올렸는데 오늘은 코랩을 이용한 프로그램을 만들어 볼 것이다. 지난 포스팅이
devbirdfeet.tistory.com
'OS & Network' 카테고리의 다른 글
Google Colab - 음성파일 텍스트로 변환하기 (Feat. Whisper) (3) | 2025.06.12 |
---|---|
Figma - 피그마에 폰트 추가하기 (Feat. 맥) (0) | 2025.02.09 |
Network - Cache 그리고 Cache-Control (5) | 2024.11.14 |
VScode - extension 오프라인으로 설치하기 (0) | 2024.07.26 |
Windows - PowerShell 에서 ohmyzsh git alias 명령어 적용하기 (0) | 2024.06.04 |
댓글