要約
MicrosoftのAI研究所が、テキスト、音声、画像を生成する三つの基盤モデルを発表しました。これにより、同社はマルチモーダルAIモデルの強化を図り、競合他社に対抗する姿勢を示しています。特に、このモデル群はGoogleやOpenAIのものに比べてコストが安いことが売りとされています。
この新しい取り組みは、MicrosoftがOpenAIとのパートナーシップを維持しつつ、独自のAI技術を開発する戦略の一環です。MAI-Transcribe-1は25言語に対応した音声の文字起こしを高速で行い、MAI-Voice-1はカスタム音声を生成する機能を持っています。また、MAI-Image-2は動画生成モデルです。
読者が知っておくべきポイントは、これらのモデルは、より実用的なAI技術を目指していることです。Microsoftは「人間中心のAI」を掲げ、実際のコミュニケーションに基づいたモデルの開発を進めています。今後も新しいモデルがMicrosoftの製品に統合される予定です。
関連記事
- Microsoft、Copilotは「エンタメ専用」と明言—その理由とは?
- Microsoft、Windows 11のCopilot見直しへ—ユーザーの声を反映したAI体験とは?
- MicrosoftとGoogle、Anthropic Claudeの利用継続を保証—AI倫理と規制が問われる理由とは
元記事: https://techcrunch.com/2026/04/02/microsoft-takes-on-ai-rivals-with-three-new-foundational-models/
公開日: Thu, 02 Apr 2026 16:48:16 +0000
この記事はAIアシスト編集により作成されています。
📰 元記事: 元記事を読む