分享

2025 年 5 月 16 日

Cartwheel 運用 Gemini API 提升角色動畫效果

Jonathan Jarvis

共同創辦人兼技術長

Andrew Carr

共同創辦人兼首席科學家

Vishal Dharmadhikari

AI 開發人員關係維繫

Cartwheel 展示主頁橫幅

Cartwheel 運用 Gemini API 提升角色動畫技術

Cartwheel 站在新一代動畫的最前線,提供一個平台,讓使用者透過自然語言輸入 (例如「一隻貓在樹上跳舞」) 製作動畫。「跳躍」、「莎莎舞旋轉」) 直接角色動作。這項創新技術可提升創作者製作影片、遊戲、廣告和社群媒體動畫的效率。Cartwheel 整合 Imagen 3,提供直覺式的文字轉角色設計功能,並運用 Gemini 2.5 Pro 預先發布版開發精密的動畫專用演算法、探索複雜的程式碼庫,以及加快平台最佳化作業,協助使用者拓展創意敘事能力。

克服生成式 3D 動態的研發障礙

開發尖端動畫平台不僅需要簡單易用的設計工具,還必須持續創新後端演算法,並有效管理程式碼集。Cartwheel 面臨的挑戰包括快速製作原型和導入複雜的動畫功能、針對效能最佳化龐大的程式碼集,以及讓開發人員快速瞭解並貢獻大型系統。他們需要強大的 AI 合作夥伴,協助他們大幅提升開發效率。

Cartwheel 如何使用 Imagen 3 和 Gemini 2.5 Pro 預先發布版

Cartwheel 使用 Gemini API 改善面向使用者的創作流程,並輔助內部開發程序。

  • 透過 Imagen 3 運用 AI 構思角色:Cartwheel 整合了 Imagen 3 的文字轉圖像功能,讓創作者直接在平台中使用文字提示詞構思及生成獨特的角色圖像。這些量身打造的角色可使用自然語言製作動畫,然後匯出為完全綁定的角色,並在 Maya 或 Blender 等業界標準 3D 編輯軟體中編輯,以便整合至專業製作環境。
  • 使用 Gemini 2.5 Pro 搶先版輔助研發和最佳化:Cartwheel 團隊在內部使用 Gemini 2.5 Pro 搶先版,支援工程和研究工作流程:
    • 開發演算法:我們使用 Gemini 2.5 Pro 搶先版開發動畫專屬功能,包括資料合成的動態模糊演算法、混合的拉普拉斯金字塔,以及編輯器內姿勢的自動反向運動學 (IK)。
    • 程式碼探索與偵錯:團隊使用 Gemini 2.5 Pro 搶先版探索複雜的程式碼集、發想新實驗的點子,並協助有效率地偵錯極端情況,例如複雜的相機旋轉錯誤。
    • 運用長脈絡進行程式碼集作業:Gemini 2.5 Pro 搶先版具備長脈絡功能,可處理 Cartwheel 的整個程式碼集。舉例來說,開發人員可將新的程式碼庫 (例如前端) 帶入情境,協助新增功能,或詢問系統架構和功能的高階問題。

提升動畫工作流程效率

Cartwheel 打算使用 Gemini 2.5 Pro 搶先版輔助演算法開發、程式碼探索和偵錯,藉此提升開發程序,並加快平台最佳化速度。整合 Imagen 3 後,使用者就能以簡化的方式從文字生成角色圖像,而 Gemini 2.5 Pro 搶先版則可做為工具,協助開發人員建構基礎技術。這些整合功能可協助 Cartwheel 達成目標,讓動畫工作流程更快速且更容易使用,例如:

  • 加速遊戲和影片的素材資源製作流程,讓團隊專注於核心設計。
  • 協助有效生成行銷和社群媒體內容。

「動畫是將腦海中的故事呈現給世人的最純粹方式之一。我們正在開發相關工具,讓所有人都能輕鬆使用這項技術!」

- Cartwheel 執行長 / 共同創辦人 Jonathan Jarvis

打造動畫的未來

Cartwheel 整合 Imagen 3 和 Gemini 2.5 Pro 預先發布版,充分展現 Google AI 如何應用於新使用者功能,並協助開發新一代工具所需的複雜開發工作。

請參閱 Gemini API 說明文件,瞭解 Imagen 3,並在 Google AI Studio 中開始使用。

Cartwheel 是 Google AI Futures Fund 的參與者,該基金會投資並與雄心勃勃的新創公司合作,共同打造 AI 的未來。