小型AIの新たな可能性!NeedleがGeminiを活用した注目のモデルを発表

要約

Needleは、Gemini 3.1を基にした26Mパラメータの「Simple Attention Network」を開発したプロジェクトです。このモデルは、MacやPCでローカルにファインチューニングが可能で、Cactus上では6000トークン/秒のプリフィルと1200デコード速度を実現しています。全ての重みはCactus-Compute/needleで公開されており、データセットの生成もオープンです。

この開発は、消費者向けデバイス(スマートフォン、スマートウォッチ、メガネなど)向けに小型AIを再定義することを目指した実験的な取り組みです。Needleは、FunctionGemma-270mやQwen-0.6B、Graninte-350m、LFM2.5-350mと比較して、シングルショットの関数呼び出しにおいて優れた性能を発揮しますが、これらのモデルは会話の設定での能力が高いという特徴があります。

このモデルを利用するための手順は非常に簡単で、指定されたリポジトリをクローンし、必要なセットアップを行うことで、すぐに自分のツールでテストやファインチューニングが可能です。特に、シンプルなインターフェースを通じて、簡単に自分のデータを使ったトレーニングが行える点が魅力です。


元記事: https://github.com/cactus-compute/needle

公開日: Tue, 12 May 2026 18:03:11 +0000


この記事はAIアシスト編集により作成されています。

📰 元記事: 元記事を読む

コメントする