Python/音声合成モデルの開発・推論最適化におけるAIエンジニア | フリーランスエンジニア向け案件サイト【ブーストフリーランス】

閲覧済み

リモート

~165万円（想定年収：~1980万円）

140~180時間

当月末日締 / 翌月末日払（30日サイト）

業務委託（フリーランス）

六本木

一部リモート

職務内容

大規模なエンタメプラットフォームにおける最先端の音声合成（TTS）モデルの開発や推論最適化を主導していただきます。モデルの追加学習やカスタマイズから、GPU環境での効率化、サービスへの統合にいたるまで一連の工程に携わることができるポジションです。【仕事内容】下記の業務を担っていただく想定です。・音声合成モデルを用いた追加学習や話者・感情の制御機能の実装・GPU環境におけるバッチ処理やキャッシュ管理、量子化などによる推論の効率化・リップシンクなどへの応用を見据えた、音素タイムライン生成機能のシステム統合・推論基盤の設計・運用、および応答速度やサービス品質の管理 ※詳細は面談時にお伝えします。

最寄駅 / 勤務形態

六本木 / 一部リモート

スキル

Python
AWS
Google Cloud Platform
Azure

必須スキル

・音声合成モデルを用いた追加学習や実務での開発経験・話者適応、感情制御、多言語対応などのカスタマイズ経験・音声データセットの構築や前処理システムの開発経験・PyTorchを用いたモデル学習や、効率的な追加学習手法の実装経験・GPU環境における推論最適化（バッチ処理、キャッシュ管理、量子化、ストリーミング生成）の実務経験・推論基盤（vLLM、TensorRT-LLMなど）の選定、導入、最適化の経験・同時実行数の調整や応答速度の改善に関する実務経験・CUDAの最適化やメモリ効率化に関する深い知見・REST API、WebSocket、gRPCの設計や、ストリーミング配信の実装経験・推論サービスの冗長化、自動拡張、監視基盤の構築経験

尚可スキル

・音素タイムライン生成を音声合成システムへ統合した経験・リアルタイムでの音声対話やアバターのリップシンクなどの開発経験・日本語能力試験1級相当の語学力、またはビジネスレベルの英語力・大手IT企業や音声AI専門企業における音声合成モデルの開発・運用経験

案件の特徴

・独自のデータや事業領域に関心を持ち、新しい価値の創出に貢献する意欲のある方・難易度の高い課題に対しても、粘り強く研究開発を推進できる方・自律的に行動し、未知の領域にも積極的に挑戦できる方・組織内外との円滑な連携を通じて、プロジェクトを推進できる方

契約期間

初月単月（以降、複数月更新）

面談回数

1回

情報提供元：テクフリ15時間前

TOP