Back to automation
automation 1 min read 26 lines

kaggle-music-voice-gen

음악/음성 생성 가이드 — ACE-Step 1.5 (카글) + edge-tts (로컬, 기본 TTS)

음악/음성 생성

⚠️ 2026-04-16 변경: TTS를 edge-tts로 전환. 음악 생성(ACE-Step)은 카글 수동 구동 시에만 사용.

TTS (기본: edge-tts)

qwen3-tts 스킬 참조

음악 생성: ACE-Step 1.5 (카글, 수동)

카글 T4 GPU에서 인스트루멘탈 음악 생성.

주의사항 (T4)


  • ACESTEP_DTYPE=float32 필수
  • uv venv 패키지 사용 시 sys.path 추가 필요
  • wav 출력 후 ffmpeg으로 mp3 변환

사용 중단 사유 (상시 서버 불가)


  • 카글 40분 유휴 타임아웃
  • 주간 GPU 30시간 제한

Related Skills / 관련 스킬

agent-benchmark-tracker

AI 에이전트/모델 벤치마크 결과를 추적하여 Notion에 기록 — SWE-bench, HumanEval, GAIA, WebArena, LiveCodeBench 등

agentnews-monitor

AgentNews 실시간 모니터링 — 매시간 AI 에이전트 뉴스 피드를 확인하고 관심사 매칭 뉴스를 threshold 기반으로 알림 (하루 2~3건 제한)

ai-model-tracker

AI 모델 릴리즈/업데이트를 매일 Notion에 기록 — 새 모델 출시, 벤치마크, 가격 변동 추적

auto-researcher

심층 자동 조사 — 주제를 받아 여러 소스에서 수집 후 종합 리포트 작성