2024-12-09 Topics

Page content

2024-12-09 Topics

AIエージェント

AIが2時間の対話で人格を再現:スタンフォード大学とGoogle DeepMindの挑戦 | Ledge.ai

スタンフォード大学とGoogle DeepMindが、2時間の対話を通じてAIの人格を再現する挑戦について述べています。AIエージェントの技術や関連する研究が紹介され、最新のAI関連情報が提供されています。

「マインクラフト」で最大1000人のAIエージェントが共同生活する社会実験で宗教や文化的ミームが広まったと判明 - GIGAZINE

AIエージェントを用いた「マインクラフト」での社会実験「Project Sid」では、最大1000人のエージェントが共同生活をし、農業や文化的ミームの伝播、民主主義的な意思決定が確認されました。エージェントは専門的な役割を持ち、経済圏を形成し、宗教的概念も広がるなど、人工的な文明の形成に向けた進展が示されていますが、基本的な能力には課題が残っています。

AIサービス

Microsoft、Webサイトの内容について会話できる「Copilot Vision」プレビュー開始

Microsoftは「Copilot Vision」の限定プレビューを開始し、Webページの内容を理解しユーザーと会話するAI機能を提供。ユーザーは音声で質問し、関連情報を得ることができ、プライバシーに配慮した設計がなされている。現在、米国のMicrosoft Copilot Proプラン加入者のみが利用可能で、フィードバックを基に改良予定。

Introducing ChatGPT Pro

ChatGPT Proは、OpenAIの最も高度なモデルへの無制限アクセスを提供する月額200ドルのプランで、研究者やエンジニアが生産性を向上させるためのツールです。o1プロモードでは、より信頼性の高い応答を生成し、医療研究者に対して10の助成金が授与されます。将来的には、さらに計算集約的な機能が追加される予定です。

AI経済

黒字化のメドが立たない…OpenAIは「本当に大丈夫」なのか?グーグルと比較してわかった「驚きの赤字額」(小林 雅一) | 現代ビジネス | 講談社(1/6)

OpenAIはChatGPTの成功にもかかわらず、年間約50億ドルの赤字を抱えており、黒字化の目途が立っていない。グーグルと比較すると、OpenAIの赤字額は桁外れで、早期の黒字化には広告事業への参入が最も効果的とされるが、CEOのサム・アルトマンは慎重な姿勢を崩していない。将来的にはAIが21世紀の電力のような社会インフラになることを目指しているが、その実現には多くの課題が残されている。

Metaも原子力発電への取り組みを発表 Microsoft、Google、Amazonに続き - ITmedia NEWS

Metaは、AIイノベーションと持続可能性目標を支援するために原子力発電事業者を選定する提案依頼書を発行し、2030年代初頭からの新規原子力発電能力の確保を目指している。原子力発電はクリーンで信頼性が高く、データセンターの電力需要を満たすだけでなく、地域の電力網の成長ニーズを支える基盤となると述べている。Microsoft、Google、Amazonも原子力発電に関心を示している。

AWS

週刊生成AI with AWS – re:Invent 2024特別号 (2024/12/2週) | Amazon Web Services ブログ

AWS re:Invent 2024では、生成AIに関する新サービスが発表され、特にAmazon Q Developerがドキュメント生成、コードレビュー、ユニットテスト機能を追加しました。また、Amazon Bedrockでは新たに基盤モデルやデータ処理機能が強化され、次世代のAmazon SageMakerが統合プラットフォームとして登場しました。これにより、AI/MLトレーニングや推論がより効率的に行えるようになります。

週刊AWS – re:Invent 2024特別号 part 2 (2024/12/2週) | Amazon Web Services ブログ

AWS re:Invent 2024の特別号Part 2では、Generative AIやMachine Learning、Contact Center、Management & Governance、Security, Identity, & Complianceに関する主要なアップデートが紹介されています。新しい機能には、Amazon Nova基盤モデル、Amazon Bedrockのモデル蒸留、Amazon ConnectのAIボット作成機能、宣言型ポリシーの導入、AWS Security Incident Responseサービスなどが含まれています。また、re:Capイベントの案内もあり、参加を促しています。

週刊AWS – re:Invent 2024特別号 part 1 (2024/12/2週) | Amazon Web Services ブログ

AWS re:Invent 2024の特別号として、様々なサービスのアップデートが発表されました。主な内容には、次世代Amazon SageMakerの導入、AWS Glue 5.0の一般提供、Amazon EC2 Trn2インスタンスの発表、Amazon Aurora DSQLのプレビューなどが含まれています。また、AWS Clean Roomsが複数のクラウドとの連携をサポートし、Amazon S3 Tablesが分析ワークロードに最適化されるなど、データ管理と分析の効率化が図られています。詳細は各リンクから確認できます。

[AWS Black Belt Online Seminar] AWS re:Invent 2024 速報 資料及び動画公開のご案内 | Amazon Web Services ブログ

AWS re:Invent 2024の速報として、新サービスや機能を紹介するAWS Black Belt Online Seminarの資料と動画が公開されました。参加者は新サービスの概要を日本語で学ぶことができ、過去のセミナー資料へのリンクも提供されています。今後の関連イベントや週刊AWSのアップデートも予定されています。

【速報】Amazon Q in QuickSight Scenarios 誕生。シナリオ分析で複雑な問題解決を支援 | DevelopersIO

Amazon QuickSightに新たに追加されたシナリオ分析機能により、自然言語での質問から複雑なデータ分析が可能になり、従来のスプレッドシート作業に比べて最大10倍の分析速度を実現。AIによる分析提案や自動データ分析機能を活用し、データドリブンな意思決定を迅速に行える強力なツールとして期待されている。

[新サービス] 分析と人工知能(AI)をシンプルに統合化したデータレイクハウス、Amazon SageMaker Lakehouse が発表されたので実際に試してみました #AWSreInvent | DevelopersIO

Amazon SageMaker Lakehouseは、データ分析とAI/MLを統合する新しいプラットフォームで、データレイクとデータウェアハウスの境界を取り払い、単一のデータコピーで強力な分析を可能にします。ユーザーは複数のデータストアを管理する必要がなくなり、効率的に作業を進められ、セキュリティと柔軟性を兼ね備えたこのサービスは企業のデータ戦略を大きく前進させる可能性があります。

Announcing AWS Transfer Family web apps for fully managed Amazon S3 file transfers | AWS News Blog

AWS Transfer Familyのウェブアプリを使用すると、認証されたユーザーが特定のAmazon S3バケット内のファイルを簡単に管理できる完全管理型のノーコードウェブアプリを作成できます。セキュリティ、カスタマイズ、AWSエコシステムの利点を活かしながら、ユーザーはファイルのアップロード、ダウンロード、削除が可能です。設定手順も詳細に説明されており、IAMポリシーやユーザー管理の方法も含まれています。

DevOps

XユーザーのOpenAI Developersさん: 「🆕 The Usage API—track API usage and costs programmatically. 👀 Monitor token use by minute/hour/day 🔎 Filter usage by API key, project ID, user ID, model, and more 💹 Check daily spend via the Costs endpoint https://t.co/bpAXLAsA81」 / X

OpenAIのUsage APIを使用してAPIの使用状況とコストをプログラム的に追跡できます。トークン使用量を分単位、時間単位、日単位で監視し、APIキー、プロジェクトID、ユーザーID、モデルなどでフィルタリングできます。また、コストエンドポイントを通じて日々の支出を確認できます。

LLM

OpenAI o1 System Card

OpenAI o1システムカードは、OpenAI o1およびo1-miniのリリース前に実施された安全性作業を概説しています。評価の主要分野には、禁止されたコンテンツ、トレーニングデータの再現、幻覚、バイアスが含まれます。準備状況スコアカードでは、サイバーセキュリティが低、CBRNが中、説得力が中、モデルの自律性が低と評価されています。ポスト緩和スコアが「中」以下のモデルのみが展開可能で、「高」以下のモデルのみがさらに開発可能です。

Introducing PaliGemma 2: Powerful Vision-Language Models, Simple Fine-Tuning - Google Developers Blog

PaliGemma 2は、視覚と言語を統合したモデルで、簡単なファインチューニングを可能にし、さまざまなタスクに対してスケーラブルなパフォーマンスを提供します。新機能には、詳細なキャプション生成や化学式認識、音楽スコア認識などが含まれ、既存のPaliGemmaユーザーにとっては簡単にアップグレード可能です。モデルとコードはHugging FaceやKaggleから入手でき、さまざまなフレームワークで利用できます。

The Amazon Nova family of models: Technical report and model card - Amazon Science

Amazon Novaは、最先端の基盤モデルの新世代であり、優れた知能と業界をリードする価格性能を提供します。Amazon Nova Proは、高精度・高速・低コストのマルチモーダルモデルで、幅広いタスクに対応。Amazon Nova Liteは、画像、動画、文書、テキストを迅速に処理する低コストのマルチモーダルモデル。Amazon Nova Microは、非常に低コストで最低遅延の応答を提供するテキスト専用モデル。Amazon Nova Canvasは、プロフェッショナルグレードの画像を生成する画像生成モデルで、豊富なカスタマイズ機能を備えています。Amazon Nova Reelは、高品質な出力、カスタマイズ、動作制御を提供する動画生成モデルです。これらのモデルは、顧客の信頼、安全性、信頼性に対する責任を持って構築されました。コア機能、エージェント性能、長文コンテキスト、機能適応、ランタイム性能、人間評価のベンチマーク結果を報告します。

[アップデート] Amazon Novaシリーズモデルが登場しました #AWSreInvent | DevelopersIO

Amazon Bedrockに新たに追加されたNovaシリーズモデルには、動画生成モデルのNova Reel、マルチモーダル理解の基盤モデルNova ProとNova Lite、軽量なText-to-TextモデルNova Micro、画像生成モデルNova Canvasが含まれています。これらのモデルは、英語を含む多言語に対応し、さまざまなユースケースでの利用が期待されています。

数個のパラメータ削除でAIが崩壊?驚きのLLM研究(2024-11)【論文解説シリーズ】 - YouTube

この動画では、特定のパラメータ「スーパーウェイト」を除去すると大規模言語モデルの精度が劇的に低下することが発見され、モデル圧縮と低ビット量子化を用いた新しい手法が提案されています。この研究はLLM特有のもので、他の深層学習モデルへの適用は未検証ですが、自然言語処理と機械学習最適化に革新をもたらす可能性があります。

PLaMo

国産の大規模言語モデルPLaMoの新モデルPLaMo Primeが提供開始され、クラウド型API製品PLaMo APIとアシスタントチャットPLaMo Chatの無料トライアルも実施中です。PLaMo Primeは、長文処理や日英翻訳性能の向上、外部システムとの連携機能を強化し、幅広い自然言語タスクに対応しています。利用方法や料金についても詳細が記載されています。

LLMOps

Reinforcement Fine-Tuning Research Program | OpenAI

OpenAIは、特定の複雑なドメイン固有のタスクに優れた専門モデルを作成するために、強化ファインチューニング研究プログラムを拡大しています。このプログラムでは、開発者が高品質なタスクを使用してモデルをカスタマイズし、モデルの応答を評価することができます。法務、保険、医療、金融、工学などの分野での応用が期待されており、参加希望者は申請フォームを提出する必要があります。

ChatGPTに特定の人物名を入力すると動作が停止することが判明 - GIGAZINE

特定の人物名を入力するとChatGPTが応答を生成できず、会話が強制終了する問題が報告されています。特に「David Mayer」や「Brian Hood」などの名前が影響を受けており、これによりフィルタリングが行われている可能性があります。この現象はChatGPTのウェブインターフェースでのみ確認され、OpenAIはこの問題に対処する必要があるとされています。

モダンデータスタック

[新機能]Snowsight上でテーブル・カラムのDescriptionを自動生成できるようになりました | DevelopersIO

SnowsightでテーブルとカラムのDescriptionを自動生成できる新機能が追加されました。テーブルのDescriptionは

Snowflake、Anthropicとの協力によりClaudeモデルをAIデータクラウドに直接導入 | Snowflake合同会社のプレスリリース

SnowflakeとAnthropicは戦略的パートナーシップを結び、Claude 3.5モデルをSnowflake Cortex AIを通じて提供します。この提携により、企業は安全なデータ環境内で高度なAI機能を活用し、信頼性の高いAI製品やアプリを開発できるようになります。ClaudeはSnowflakeのエージェント型AI製品を支える主要な大規模言語モデルとして機能し、企業はデータ分析や業務の効率化を図ることができます。

2024年11月にリリースされたSnowflakeの新機能・変更点のまとめ #SnowflakeDB | DevelopersIO

2024年11月にリリースされたSnowflakeの新機能には、複数のアプリインスタンスのインストール、Cortex LLM関数の翻訳機能の強化、アウトバウンド接続の改善、機密データの自動分類機能、全文検索機能、サーバーレスタスクのPythonおよびJVMサポートなどが含まれています。また、内部マーケットプレイスの一般提供や、データリネージ機能の提供も発表されました。詳細は公式ドキュメントを参照してください。

生成モデル

GenCast predicts weather and the risks of extreme conditions with state-of-the-art accuracy - Google DeepMind

GenCastは、気象の不確実性とリスクを予測する新しいAIモデルで、最大15日先の天気予報をより迅速かつ正確に提供します。このモデルは、過去40年間の気象データを基にし、従来の予測システムよりも優れた精度を持ち、特に極端な気象イベントの予測において高い性能を示しています。GenCastはオープンモデルとして提供され、気象予測コミュニティとの協力を促進し、持続可能なエネルギー計画や災害対応においても重要な役割を果たすことが期待されています。

Genie 2: A large-scale foundation world model - Google DeepMind

Genie 2は、無限の多様な3D環境を生成できる基盤ワールドモデルであり、AIエージェントのトレーニングと評価に利用されます。このモデルは、単一のプロンプト画像に基づいて、行動可能な環境を生成し、複雑なキャラクターアニメーションや物理シミュレーションなどの能力を持っています。Genie 2は、迅速なプロトタイピングを可能にし、AIエージェントが未経験の環境でタスクを実行するための新しいワークフローを提供します。