テザー社が STEM 特化 AI データセット公開!

みなさん、こんにちは。

テザー社がSTEM特化の大規模AI学習用データセット「QVACジェネシスI」を公開

ステーブルコインで有名なテザー社が、科学・技術・工学・数学(STEM)分野に特化したAIモデルの学習用に設計された大規模な合成データセット「QVACジェネシスI」をリリースしました。これは、AIの研究や開発を支援するために作られたもので、410億テキストトークンという膨大な量のデータを含んでいます。

テザー社のCEO、パオロ・アルドイノ氏は「知性は特定の企業に集中すべきではなく、誰もが自由にアクセスし所有できるべきだ」と述べており、このデータセットを通じてAIの知性をよりオープンにしようとしています。

このデータセットは、単に単語を学習するだけでなく、因果関係や論理的な関連性を理解し、複雑な問題解決や推論ができるAIモデルの育成を目指している点が特徴です。さらに、厳密な検証プロセスを経て作成されており、教育コンテンツ向けに特化した初の公開データセットとも言われています。

プライバシー重視のローカルAIアプリ「QVACワークベンチ」も同時リリース

テザー社は同時に、ユーザーのデバイス上でAIとのやり取りをローカルに保存し、プライバシーを守ることに重点を置いたアプリ「QVACワークベンチ」も公開しました。現在はアンドロイド版が利用可能で、iOS版も数日以内に対応予定です。デスクトップ版もWindows、macOS、Linuxで動作します。

このアプリは、ユーザーのスマホやPCにAIの処理を任せる仕組みで、データが外部に送られないため、個人情報の漏洩リスクを抑えられます。また、「委任推論」という機能により、モバイルとデスクトップを連携させて自宅やオフィスの高性能マシンのリソースを活用することも可能です。

テザー社はUSDTという世界最大のステーブルコインを発行している企業で、AIや投資など多方面に事業を広げており、今年の利益は2.3兆円に達する見込みとも言われています。

今回の取り組みは、AIの知識や技術が一部の大企業に独占されるのではなく、より多くの人が自由に利用できる環境を作ろうという動きの一環と捉えられそうです。

個人的には、AIの学習データがオープンになることで、より多様な研究やイノベーションが生まれる可能性が高まるのではないかと感じました。特にSTEM分野に特化した高品質なデータセットは、教育や研究の現場で役立つことが期待されますね。引き続きウォッチしていきたいですね!