Trained LLMs exclusively on pre-1913 texts

## 要約

**歴史的テキストに基づくLLMの開発**

最近、スイスのチューリッヒ大学とケルン大学の研究者たちが、1913年以前の歴史的テキストのみを用いて大規模言語モデル(LLM)を開発しました。このプロジェクトは、科学的な応用を目的としており、特定の時代の知識を持つモデルのリリースを目指しています。具体的には、80億トークンのデータを使用して、新たに4億パラメータのモデルを訓練しています。

この研究は、歴史的な文脈や価値観を理解するために重要です。過去のテキストを基にモデルを構築することで、現代の問題に対する歴史的な視点を提供し、私たちの文化や社会の理解を深めることが期待されています。また、過去の視点を取り入れることで、現在の倫理的な判断に影響を与えずに、時代ごとの価値観を反映した情報を提供できます。

読者が知っておくべきポイントとして、モデルは1913年以前の知識しか持たず、そのため歴史的な人物や出来事に関する情報が限られています。例えば、アドルフ・ヒトラーに関する知識は全く持っておらず、過去の価値観や意見がそのまま反映されることがあるため、使用に際して注意が必要です。このようなモデルが持つ特異性は、歴史研究や教育において新たな可能性を示唆しています。

## 編集部コメント

AIの進化は私たちの働き方や創造性に新しい可能性をもたらしています。この動向がどのように発展していくか、引き続き注目していきましょう。

**元記事**: [https://github.com/DGoettlich/history-llms](https://github.com/DGoettlich/history-llms)

**公開日**: Thu, 18 Dec 2025 22:39:47 +0000

*この記事はAIアシスト編集により作成されています。*

📰 元記事: 元記事を読む

コメントする