54 items with this tag.
LiteratureNotes
LiveKit Agentsにおける音声カスタマイズ機能。TTSキャッシュによるレイテンシ削減・コスト削減、発音カスタマイズ(テキスト置換・SSML)、音量調整の3本柱について、実装パターンと適用判断軸を整理する。
LiteratureNotes
LiveKit Agents の frontdesk サンプルについて、Agent / AgentSession / Calendar 抽象化 / function tool / 評価フローの責務分離と実装意図を整理する。音声予約エージェントを実務寄りに組む際の設計パターンを記録する。
LiteratureNotes
LiveKit Agents SDKでセッションデータ(文字起こし、メトリクス、使用量、音声録音)をローカル収集し、外部システム(Langfuse等)に統合するAPI。OpenTelemetry連携、ターン別レイテンシ計測、モデル別使用量トラッキングを含む。
LiteratureNotes
LiveKit Cloud内蔵のオブザーバビリティダッシュボード。文字起こし、トレース、ログ、音声録音を統合タイムラインで表示し、セッションごとの録音制御も可能。
LiteratureNotes
LiveKit Cloudのコンテナビルドプロセス、Dockerfileの要件とベストプラクティス、Python/Node.js公式テンプレートの設計思想を記録する。
LiteratureNotes
LiveKit AgentをLiveKit Cloud以外の自前インフラ(Kubernetes、Render等)にデプロイするための実践ガイド。アーキテクチャ、ネットワーク、リソース設計、オートスケーリング戦略を扱う。
LiteratureNotes
LiveKit Agentのオブザーバビリティ機能の全体像。Insights、Data Hooks、Log Drains、Logsの4コンポーネントと、LiveKit Cloud前提という制約を整理する。
LiteratureNotes
LiveKit CloudにおけるAgentログの3種類(Runtime/Build/Session)とそれぞれの確認方法、ログレベル、外部サービスへの転送について記録する。
LiteratureNotes
LiveKit CloudにおけるRuntime logsの外部監視サービスへの転送。Datadog/CloudWatch/Sentry/New Relicへの設定方法、ログフィールド、トラブルシューティングを記録する。
LiteratureNotes
LiveKit AgentsにおけるRealtimeモデル(音声→音声の直接変換)の概要。プラグイン一覧、half-cascade構成、ターン検出や文字起こし等の制約について扱う。
LiteratureNotes
LiveKit Agentsにバーチャルアバター(同期された音声+動画出力)を追加する仕組みの概要。AvatarSessionの使い方、2参加者モデルのアーキテクチャ、フロントエンドでの識別方法について扱う。
LiteratureNotes
LiveKit CloudへのAgentデプロイ手順。CLI3コマンドで登録・ビルド・デプロイまで完結する最小フローと、デプロイ後のステータス・ログ監視方法を記録する。
LiteratureNotes
LiveKit CloudにおけるAgentデプロイの継続管理。livekit.toml設定、ローリングデプロイ、ヘルスチェック、ロールバック、コールドスタートの仕組みを記録する。
LiteratureNotes
LiveKit CloudにおけるAgent用機密情報の管理。Secretの暗号化保存・ランタイム注入、CLI設定方法、制約事項、ファイルマウントについて記録する。
LiteratureNotes
LiveKit AgentsにおけるTTS(Text-to-Speech)モデルの全体像。Inference経由とPlugin経由の2ルート、対応プロバイダー一覧、Standalone Usage、LanguageCodeの正規化機構について扱う。
LiteratureNotes
LiveKit AgentsにおけるLLM利用の全体像。Inference/Pluginの使い分け、モデルパラメータ、Standalone usage、collect()によるツール連携フローを整理する。
LiteratureNotes
LiveKit Cloudに組み込まれた統合モデルインターフェース。STT/LLM/TTSをプラグインなし・APIキー個別管理なしで利用する仕組みと、対応モデル一覧、課金体系について整理する。
LiteratureNotes
LiveKit Inferenceの発表記事。STT/LLM/TTSモデルへの統合API、同時実行制限と課金の一元管理、レイテンシ最適化の3本柱について解説する。
LiteratureNotes
LiveKit Agentsで利用可能なモデルアクセスの2つの経路(Inference / Plugin)と、その使い方・混在方法を整理する。
LiteratureNotes
LiveKit Agentsで利用可能なSTTモデルの全体像。Inference/Plugin経由のモデル一覧、自動モデル選択、StreamAdapter、MultiSpeakerAdapter、LanguageCode正規化について整理する。
LiteratureNotes
LiveKit AgentsのGoogle Gemini連携におけるProvider toolsの種類、利用条件、実装上の制約を整理し、Function toolsとの使い分け判断を明確化する。
LiteratureNotes
LiveKit AgentsでxAI Grok Voice Agent APIを利用する際のRealtimeモデル設定、Provider tools構成、ターン検出の実装ポイントを整理する。
LiteratureNotes
LiveKit AgentsにおけるSilero VADの役割と、prewarm・主要設定パラメータ・運用時の調整観点を整理したノート。
LiteratureNotes
LiveKit Agents の turn_handling 設定を対象に、turn detection・endpointing・interruption の各パラメータと相互作用を整理した読解ノート。Python実装時の時間単位、フォールバック、誤割り込み復帰挙動を中心に記録する。
LiteratureNotes
LiveKit Agents のイベントモデルとエラーハンドリングを整理し、会話進行観測・割り込み評価・障害時フォールバックの実装判断軸を記録する。公式リファレンスと公式サンプル(inactive_user.py / error_callback.py)を基準にまとめる。
LiteratureNotes
LiveKit Agents に外部データ接続を導入する際の初期コンテキスト注入、会話中RAG、ツール呼び出し、ユーザーフィードバック設計の実装要点を整理する。
LiteratureNotes
LiveKit AgentSession におけるターン検出の仕組み・5つのモード・割り込み処理の設計と設定パラメータを記録する。
LiteratureNotes
LiveKitが提供するオープンウェイトのターン検出モデル(MultilingualModel)の仕様・設定・ベンチマークを記録したノート。VADとの組み合わせ方、endpointingパラメータの役割、Realtime Model使用時の注意点を中心に整理する。
LiteratureNotes
VADだけでは区別できないバックチャネリングと本物の割り込み(barge-in)を音響モデルで判別する仕組みの解説。使用条件・設定方法・aligned transcriptの役割を記録する。
LiteratureNotes
LiveKit Agentsのパイプライン処理における差し込みポイント(ノード・フック)の種類、シグネチャ、実装判断の軸を記録する。
LiteratureNotes
LiteratureNotes
LiveKit AgentsにおけるMCP統合の接続方式、権限制御、複数サーバー運用、Agent/AgentSessionの上書き挙動を整理した読解ノート。公式MCPレシピの実装フローとの対応関係も記録する。
LiteratureNotes
LiveKit Agentsにおけるツール呼び出しのRPC転送パターンを整理し、Agent側アダプタ実装とFrontend側ハンドラ実装の責務分離を記録する。
LiteratureNotes
Tasks and Task Groupsの内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
LiteratureNotes
Agents and handoffsの内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
LiteratureNotes
Workflowsの内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
LiteratureNotes
Logic and Structure Overviewの内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
LiteratureNotes
RoomIO (Agent Session Context)の内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
LiteratureNotes
Agent Sessionの内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
LiteratureNotes
Server Startup Modesの内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
LiteratureNotes
Job Lifecycleの内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
LiteratureNotes
Agent Dispatchの内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
LiteratureNotes
Server Lifecycleの内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
LiteratureNotes
Voice AI Quickstartの内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
LiteratureNotes
Text and Transcriptionsの内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
LiteratureNotes
Agent Speech and Audioの内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
LiteratureNotes
LiveKit Basics Overviewの内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
LiteratureNotes
Rooms, Participants, and Tracksの内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
LiteratureNotes
Webhooks and Eventsの内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
LiteratureNotes
Agents Framework Introductionの内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。
SourceNotes
LiveKit Agents Documentationの出典情報を管理するSourceNote。参照メタデータと関連ノートへの導線をまとめる。
StructureNotes
LiveKit Agent Framework 学習ロードマップに関するノート群の入口として、論点・参照順・関連リンクを整理するStructureNote。
LiteratureNotes
Technology Fundamentals & How Voice Agents Work - Section 2 - Lecture 11の内容を読解し、概念・構成要素・実装時の着眼点を整理したLiteratureNote。