GLM 5.2がセキュリティAIの新たな競争者に!Claudeを超える性能を記録

要約

GLM 5.2は、Zhipu AIが開発したオープンウェイトモデルで、IDOR検出において、Claude Codeを上回る39%のF1スコアを記録しました。この結果は、同じデータセットとプロンプトを使用したベンチマークで得られたもので、セキュリティタスクにおけるAIエージェントの利用が進む中、非常に注目されます。

GLM 5.2は、MITライセンスのもとでパラメータが公開されており、ユーザーが自身のハードウェアで実行したり、ファインチューニングしたりできる点が特に重要です。また、7500億のパラメータを持ちながらも、トークンごとに約400億のアクティブパラメータを使用するミクスチャー・オブ・エキスパート(MoE)モデルで、長いコンテキストを扱う能力にも優れています。

このモデルの成功は、セキュリティチームにとって重要な意味を持ちます。特に、IDORのようなアクセス制御の問題に対して、異なるファイルを横断して推論を行う能力が求められるため、GLM 5.2の性能が注目されています。セキュリティタスク向けの新たな選択肢として、GLM 5.2の実力がどのように活かされるのか、今後の展開が期待されます。


元記事: https://semgrep.dev/blog/2026/we-have-mythos-at-home-glm-52-beats-claude-in-our-cyber-benchmarks/

公開日: Sun, 28 Jun 2026 17:50:47 +0000


この記事はAIアシスト編集により作成されています。

📰 元記事: 元記事を読む

コメントする