2024-12-02 Topics

Page content

2024-12-02 Topics

AIエージェント

microsoft/TinyTroupe: LLM-powered multiagent persona simulation for imagination enhancement and business insights.

TinyTroupeは、特定の人格や目標を持つ人工エージェントをシミュレートするPythonライブラリで、広告評価、ソフトウェアテスト、トレーニングデータ生成、プロジェクト管理、ブレインストーミングなどのビジネスシナリオでの活用が期待されています。LLM(大規模言語モデル)を活用してリアルな行動を生成し、人間の行動理解を深めることを目的としています。現在、開発は進行中で、フィードバックや貢献を求めています。

AIサービス

さくらインターネット、生成AIプラットフォームサービスの開発に着手。NEC製LLM「ことみ」も提供 | テクノエッジ TechnoEdge

さくらインターネットは、生成AIプラットフォームサービスの開発を発表し、NEC製の大規模言語モデル「ことみ」を提供することを明らかにしました。このサービスには、RAG(Retrieval Augmented Generation)を実現するためのベクトルデータベースやAPIが含まれ、生成AIアプリケーションの開発が容易になることが期待されています。また、データの通信や保管を日本国内で完結させることが可能になります。

AIユースケース

太陽HD、製薬データを生成AI検索 半日作業を数秒で - 日本経済新聞

太陽ホールディングスは、製薬データをAIで検索できるサービスを開発し、従来の半日かかる資料探しを数秒で済ませることが可能になった。このサービスは、チャット形式での入力を採用し、国内外の製薬会社に向けて販売を進める予定である。

中外製薬 生成AIでMR向けトレーニングアプリ開発  鈴木DXユニット長「医療者への情報の質向上に期待」 | ニュース | ミクスOnline

中外製薬は、生成AIを活用した医師面談トレーニングアプリ「Chugai AI MediMentor」を開発中で、MRの知識向上を目指している。プロトタイプは8月に導入され、対象製品の拡充を計画中。鈴木ユニット長は、トレーニングを通じて医療者への情報提供の質が向上することに期待を寄せている。

AI倫理

LinkedInの長文投稿は大半がAI生成だった可能性が大 - GIGAZINE

LinkedInの長文投稿の半分以上がAI生成である可能性が高いことが、Originality.AIの調査で明らかになった。調査によると、ChatGPTのリリース以降、AI生成コンテンツが急増し、2024年10月には54%がAIによって生成されたと報告されている。この結果はLinkedInの信頼性に疑問を投げかけるものとなっている。

AWS

[アップデート]Amazon GuardDutyが複数のFindingsやシグナルを1つにまとめる拡張脅威検出がリリースされました! #AWSreInvent | DevelopersIO

Amazon GuardDutyのアップデートにより、Extended Threat Detection機能が追加され、複数のイベントを1つにまとめて関連性を分析できるようになりました。新しいAttack sequenceタイプの検出が可能になり、IAMクレデンシャルの漏洩やS3データ漏洩に関するイベントをまとめて管理できます。この機能はデフォルトで有効化されており、GuardDuty単体でも脅威の理解と対処が容易になりました。

週刊AWS – 2024/11/25週 | Amazon Web Services ブログ

2024年11月25日の週の週刊AWSでは、AWS re:Inventの開催を告知し、主なアップデートとしてAmazon EC2のキャパシティ予約、S3の条件付き書き込み機能、AWS Cloud WANのDirect Connectサポート、Amazon AuroraのGraviton4インスタンスなどが紹介されています。また、生成AIを活用した開発アプリ「Bedrock Engineer」の紹介も行われています。次回はre:Invent特別号を予定しています。

[新サービス] AWS Data Transfer Terminal が一般提供されました #AWSreInvent | DevelopersIO

AWSが新たに一般提供を開始した「AWS Data Transfer Terminal」は、ユーザーが直接AWSの拠点にデバイスを持ち込み、データ転送を行うサービスです。現在は米国西部(オレゴン)でのみ利用可能で、ロサンゼルスとニューヨークに拠点があります。利用料金は時間単位で、データ転送量に応じた課金はありません。詳細な情報はAWSの公式ページで確認できます。

Savings Plans Purchase Analyzer の発表 | Amazon Web Services ブログ

Savings Plans Purchase Analyzerは、AWSの請求とコスト管理コンソールで利用可能になり、次回のSavings Plans購入をモデル化し、コストやカバレッジへの影響を評価するのを支援します。ユーザーは独自のコミットメント金額を入力し、カスタムルックバック期間を選択することで、柔軟に分析を行い、最適な購入戦略を計画できます。この新機能により、迅速かつ情報に基づいた意思決定が可能になります。

AWS Systems Manager の新しいエクスペリエンスのご紹介 | Amazon Web Services ブログ

AWS Systems Managerの新しいエクスペリエンスでは、クロスアカウントおよびクロスリージョンでのノード管理が改善され、さまざまなインフラストラクチャを一元的に可視化できます。新機能には、非マネージドノードの検出とトラブルシューティング、Amazon Q Developerとの統合による自然言語での質問機能が含まれています。これにより、運用アクションを効率的に実行できるようになります。

[アップデート] Amazon EC2 のオンデマンドキャパシティ予約が将来の日付を指定した予約に対応しました | DevelopersIO

Amazon EC2のオンデマンドキャパシティ予約が将来の日付を指定して予約できるようになり、5日以上先の日付での予約が可能になりました。予約には制限があり、最小予約数は100 vCPU以上、最短予約可能日は5日先、最長は120日先です。AWSが提供可能かどうかの判断があり、推奨は56日前までの予約です。HPCインスタンスは対象外ですが、定期実行のリソース予約に役立つ可能性があります。

HPC

Amazon FSx for Lustre が GPU インスタンスのスループットを最大 15 倍増加 | Amazon Web Services ブログ

Amazon FSx for LustreがElastic Fabric Adapter (EFA)とNVIDIA GPUDirect Storage (GDS)をサポートし、クライアントあたりのスループットを最大15倍(最大1,500 Gbps)向上させることを発表しました。これにより、深層学習やHPCアプリケーションのパフォーマンスが向上し、最先端のEC2インスタンスのネットワーク帯域幅を最大限に活用できます。EFAとGDSは追加費用なしで利用可能で、クライアントインスタンスは自動的にEFAを使用します。詳細なセットアップ手順やベストプラクティスについては、Amazon FSx for Lustreのドキュメントを参照してください。

ITセキュリティ

OWASP Top 10 for LLM Appplications 2025 がリリースされたので Classmethod Cloud Security Fes で登壇してみた | DevelopersIO

OWASP Top 10 for LLM Applications 2025に基づくセキュリティ対策を紹介するプレゼンテーションがClassmethod Cloud Security Fesで行われた。主なリスクにはプロンプトインジェクションや機密情報漏洩が含まれ、AWSを活用した対策としてデータアクセス制限やデータマスキングが提案された。セッションでは、各脆弱性について具体的な対策やAWSの機能が紹介された。

[アップデート]Amazon GuardDutyのでVPCエンドポイントを利用したクレデンシャルの悪用を検出できるようになりました | DevelopersIO

Amazon GuardDutyがVPCエンドポイントを利用したクレデンシャルの悪用を検出できるようになりました。これにより、EC2にアタッチされたIAMロールのクレデンシャルが漏洩し、別のAWSアカウントから悪用された場合も検出可能となります。このアップデートは、GuardDutyの検出能力を強化し、AWS CloudTrailでのネットワークアクティビティのログ記録と連携しています。今後、対応するAWSサービスのカバレッジが広がることが期待されます。

LLM

[アップデート] Amazon BedrockにRerankモデルが追加されました #AWSreInvent | DevelopersIO

Amazon Bedrockが新しいRerankモデルをサポートし、セマンティック検索の精度を向上させることが期待されています。このモデルはユーザーの意図や文脈に基づいて情報を優先的に選び出し、応答の正確性や信頼性を高める役割を果たします。モデルの有効化方法や利用可能なリージョン、APIについても詳しく説明されています。

[2411.14405] Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

Marco-o1は、標準的な回答がある分野だけでなく、明確な基準がない広範な領域への一般化を目指しています。Chain-of-Thought(CoT)ファインチューニングやモンテカルロ木探索(MCTS)を活用し、複雑な現実世界の問題解決タスクに最適化された革新的な推論戦略を採用しています。

LLMOps

[2411.15862] LLMs Do Not Think Step-by-step In Implicit Reasoning

本研究では、LLMが暗黙のChain-of-Thought(CoT)を使用する際に、中間ステップを考慮していないことが示され、経験に依存している可能性があることが明らかになりました。実験結果は、暗黙のCoTの効果が明示的なCoTと比較して不安定であることを示し、複雑なタスクを効果的にサポートするためには明示的なCoTが必要であることを再確認しています。

Introduction - Model Context Protocol

Model Context Protocol (MCP)は、LLMアプリケーションと外部データソースやツールとのシームレスな統合を可能にするオープンプロトコルです。AI搭載のIDEの構築やチャットインターフェースの強化、カスタムAIワークフローの作成に役立ちます。MCPのコアコンセプトや機能を深く探求し、開発者コミュニティに参加するための情報も提供されています。

[2411.10541] Does Prompt Formatting Have Any Impact on LLM Performance?

大規模言語モデル(LLM)の性能に対するプロンプトフォーマットの影響を調査した論文で、さまざまな人間可読テンプレート(プレーンテキスト、Markdown、JSON、YAML)を使用して、自然言語推論、コード生成、翻訳などのタスクでの性能を評価しました。実験の結果、GPT-3.5-turboはプロンプトテンプレートによって最大40%の性能変動が見られ、一方でGPT-4などの大規模モデルはこれらの変動に対してより堅牢であることが示されました。この分析は、固定プロンプトテンプレートの使用を再考する必要性を強調しています。

データエンジニアリング

本番相当の環境でdbt runを安全に検証する - Sansan Tech Blog

本記事では、dbt runを本番相当の環境で安全に検証する取り組みを紹介。検証環境のデータ量が少ないため、本番環境での問題を避けるために、特定のデータセットを使用し、生成されたデータは一定期間で削除する仕組みを導入。GitHub Actionsを利用して変更されたモデルのみをテストするフローを構築し、開発体験の向上を図った。将来的な課題として、実行時間の短縮と十分な検証性の維持が挙げられている。

プログラミング支援

ウーバーが新事業、プログラマーをギグワーカーに-AI開発支援 - Bloomberg

ウーバーは新たにプログラマーをギグワーカーとして採用し、AI開発支援の市場に参入する。新部門「スケールド・ソリューションズ」は、企業に高品質なデータセットを提供し、特にAIモデルのトレーニングに必要なデータラベリングを行う。ウーバーはインド、米国、カナダ、ポーランド、ニカラグアで多様なスキルを持つ働き手の登録を開始し、報酬はタスクの完了に応じて支払われる。

品質管理

AWS は ISO/IEC 42001 AI マネジメントシステムの認証取得を達成しました | Amazon Web Services ブログ

AWSは、AIサービスに対するISO/IEC 42001認証を取得した初の主要クラウドサービスプロバイダーであり、責任あるAIの開発と使用を促進するための国際的な基準を満たしています。この認証は、AWSがAI関連のリスクと機会を管理するために積極的な措置を講じていることを独立した第三者が検証したものであり、顧客はAWSの責任あるAIへのコミットメントに対する信頼を深めることができます。