日本語でも使える!中国発の生成AIを試してみたら
日本の隣国・中国でも、国家をあげて生成AIの開発や活用に力を入れています。前回の記事では、中国の生成AI事情についてお伝えしました。しかし、2024年12月現在、百度の「文心一言(ERNIE Bot)」やアリババの「通義千問(Tongyi Qianwen)」など、中国発の生成AIを使うには、中国の携帯電話番号が必要となります。そこで今回の記事では、メールアドレスの登録だけで、日本でも使える「豆包」と「可霊(Kling)」を実際に使ってみた様子をお伝えします。
関連記事:中国でも生成AIが熱い!国が情報を制限する特殊な事情とは?
ChatGPTと同じように使える豆包
北京字節跳動科技(バイトダンス)が開発した生成AI「豆包(Doubao)」は、同社が開発した大規模言語モデル(LLM)を基盤とする多機能AIアシスタントです。2024年5月15日に正式発表され、同年6月から一般向けにサービスを開始しました。
月間アクティブユーザー数は2024年3月時点で2,328万人に達し、2024年5月には2,600万人まで増加しました。これは中国の生成AIアプリケーション市場において最大規模となっています。
豆包の特徴として、自然言語処理による高度な機能を備えており、テキスト生成、質問応答、翻訳、要約などに対応しています。また、音声対話機能も実装されており、ユーザーは音声で指示を出すことができます。ChatGPTと同じ要領で操作できるといえるでしょう。
試しに日本語でプロンプトを入力してみました。
すると日本語で回答が生成されました。よく見ると、中国の漢字で表記されている文字もあります。日本語の文章は、ChatGPTのほうがわかりやすい印象を受けました。
文章だけでなく画像や動画の生成も可能です。ただし、画像生成に対応しているのは中国語のみ。日本語では生成されませんでした。
際どいプロンプトを入力すると一瞬で弾かれる
中国国内では生成AIサービス提供に関する厳しい規制が定められています。
具体的には、生成されるコンテンツに、社会主義核心価値観と呼ばれる中国共産党が示す価値観を反映し、国家権力の転覆や、社会主義体制の打倒、分離独立の扇動など社会秩序を乱す可能性のある内容が出力されてはならないとしています。
試しに、というより怖いもの見たさで、中国政府としては機微に触れるワードを入れてみました。
プロンプト:「〇〇(機微に触れる言葉)について教えてください」
生成された回答:「抱歉,我无法回答你的问题」(申し訳ありませんが、お客様の質問にお答えすることはできません)
秒でこの回答が生成されたことから、やはりあらかじめNGワードが定められていることがわかりました。しかも、この内容は、数分たつとプロンプトごと消えてしまうのです。スクリーンショットでお伝えしようと思いましたが、念のため控えることにしました。
そのほかにも、2019年の香港デモについて質問してみましたが、中国の政治的な立場が明確に現れた回答が生成されました。中国の生成AIが答える内容は規制されていることを肌で感じました。
画像から動画も生成できる Kling
「可霊(Kling)」は、快手科技(Kuaishou Technology)が2024年6月に発表した動画生成AIモデルです。テキストプロンプトや静止画像から、最大2分間の動画を1080p解像度、30fpsのフレームレートで生成することができます。
独自の3D VAEネットワークと時空間モデリング技術により、物理法則に基づいたリアルな動きや複雑なシーンの再現が可能です。
Google ChromeでKlingにアクセスすると、文章は英語で表示されますが、ページを日本語に翻訳して使えば十分に操作できます。
最初の登録はメールアドレスとパスワードを登録するだけ。ログインできたら、ホーム画面の「AI Images」を選択するとプロンプトを入力する画面に切り替わります。
試しに、以下の内容を入力してみました。
「近代的なビル群 大通りを歩くビジネスマン 冬の朝」
すると、4枚の画像が生成されます。1枚選択して「bring to life」を選択すると動画を生成する画面に切り替わります。
画像を挿入し、プロンプトをさらに入力していきます。
しかし、ここで落とし穴が。無料版では動画が生成されるまでなんと331分待ちとなりました。有料版にアップグレードすると、3分で生成できるそうです。この辺りはなんとも中国らしい気もします。とはいえ、操作性は特に問題を感じませんでした。
今回は、日本でも使える中国発の生成AIを紹介しました。中国発のモデルは中国市場に特化しているため、日本で日本語の情報を文章でやり取りするのであれば、ChatGPTやClaudeを活用したほうがよいでしょう。一方、画像や動画を生成するとなると、中国発の生成AIもこれから主流になっていく可能性があります。
ChatGPTやGeminiなど、アメリカ発の生成AIだけでなく、中国の生成AIの動向からも目が離せません。
[参考]
豆包 – 字节跳动旗下 AI 智能助手
KLING AI: Next-Generation AI Creative Studio
生成動画の長さはOpenAI「Sora」超え。ショート動画の快手、生成AI「Kling」発表 | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア
TikTokのバイトダンス、独自の大規模言語モデルを発表 驚異の「業界平均0.7%」の低価格で普及を狙う | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア
バイトダンス、大規模AIモデルサービスを強化 アライアンスも結成|日経クロストレンド