2024-12-16 Topics

Page content

2024-12-16 Topics

AIエージェント

Challenges in Human-Agent Communication - Microsoft Research

高度な自律エージェントは自然言語でユーザーとコミュニケーションを取るが、その複雑さから新たな人間-エージェント間のコミュニケーションの課題が生じる。12の主要な課題を特定し、透明性と制御を支える新しいデザインパターンの必要性を提唱する。

AIサービス

Google、「NotebookLM」の有料プラン追加 「音声概要」での会話機能も - ITmedia NEWS

GoogleがAIリサーチアシスタント「NotebookLM」に新機能を追加し、有料プラン「NotebookLM Plus」を発表。ユーザーは情報をアップロードして要約や質問が可能に。音声概要機能も追加され、音声での質問応答が可能。価格は月額20ドルから。一般向けは2025年初頭に提供予定。

iPhoneだけでAI画像生成できる、Apple IntelligenceのImage Playgroundが使えるiOS 18.2で、ChatGPTとSiriの統合を試してみた(CloseBox) | テクノエッジ TechnoEdge

iOS 18.2で追加されたApple IntelligenceのImage Playgroundでは、英語モードでChatGPTとの統合が可能になり、AI画像生成が楽しめる。日本語の利用もChatGPTを介して可能で、写真ライブラリからのイラスト生成や、個別の写真を基にした生成ができる。ネット接続なしでも無限に遊べる機能が魅力。

ChatGPT「Canvas」機能アップデート:OpenAI連続発表会、4日目ポイントまとめ|ChatGPT研究所

OpenAIはChatGPTのCanvas機能を全ユーザーに解放し、Pythonコードの即時実行やカスタムGPTへの統合を可能にしました。これにより、文章作成やコード開発が一つの画面でスムーズに行えるようになります。

AWS

週刊AWS – 2024/12/9週 | Amazon Web Services ブログ

コンテンツなし

週刊生成AI with AWS – 2024/12/9週 | Amazon Web Services ブログ

コンテンツなし

CloudWatch Logsの新機能フィールドインデックスでクエリのスキャン量が減ることを確認してみた | DevelopersIO

CloudWatch Logsに新たにフィールドインデックス機能が追加され、クエリの高速化とスキャン量の削減が可能に。追加料金なしで最大20個のフィールドにインデックスを作成でき、特にリクエストIDやトレースIDの利用が効果的。今後の利用が必須となる機能。

BIツール

Amazon QuickSight 2024年 アップデートまとめ | DevelopersIO

2024年のAmazon QuickSightのアップデートでは、料金体系の変更、Highcharts対応によるビジュアル表現力の向上、PrivateLinkによるセキュリティ強化、利用可能リージョンの拡大があり、ユーザーインターフェースが進化しています。特に料金変更に注意が必要です。

CV

Sora is here | OpenAI

Soraのビデオ生成モデルが正式にリリースされ、ユーザーはテキストからリアルなビデオを生成できる。新しいSora Turboは高速で、さまざまな解像度やアスペクト比に対応。利用者は最大50本のビデオを生成可能で、責任ある使用のための安全対策も講じられている。

ITセキュリティ

ChatGPTやClaudeのAPIアクセスをかたってマルウェアを配布するPython用パッケージ確認 Kasperskyが注意喚起:生成AIに注目する開発者や研究者を狙う手口とは - @IT

Kasperskyが、Python Package Indexで悪意のあるパッケージ「JarkaStealer」を発見し、機密情報を盗む手口を警告。これらのパッケージは1年以上ダウンロード可能で、1700回以上のダウンロードがあった可能性がある。

代行サービスを使ったDDoS攻撃容疑でさらに摘発された事案についてまとめてみた - piyolog

2024年12月11日、警察庁は国際共同捜査によりDDoS攻撃に関与した日本人3名を摘発。10代の少年も含まれ、攻撃はクリスマスシーズン前に行われた。警察はDDoS攻撃サービス利用者への注意喚起を強化している。

LLM

The next chapter of the Gemini era for developers - Google Developers Blog

Gemini 2.0 Flashは、開発者がAIアプリをより迅速かつ簡単に構築できるようにする新機能を提供し、リアルタイムのマルチモーダルアプリケーションやAIコードエージェント「Jules」を通じて生産性を向上させます。

Google introduces Gemini 2.0: A new AI model for the agentic era

GoogleはGemini 2.0を発表し、マルチモーダル機能やエージェント機能を強化した新しいAIモデルを提供。開発者向けに実験版をリリースし、検索や他の製品への統合を進める。安全性と責任を重視しつつ、AIエージェントの可能性を探求している。

LLMOps

Gemini 2.0 Flash から MCP を利用して BigQuery を操作する

Gemini 2.0 FlashとMCPを利用して、LLMからBigQueryを効率的に操作する方法を紹介。高速なレスポンスと標準化されたツール連携により、AIエージェントの開発が容易に。今後の応用が期待される。

LLMガードレールソリューションの比較

LLMアプリケーションのリスク管理には「ガードレール」が重要で、Llama Guard、NeMo Guardrails、Guardrails AIの3つのソリューションが比較されている。各ソリューションは特性が異なり、シンプルさ、柔軟性、手軽さに応じた選択が推奨される。

数学的に正しい自動推論チェックにより、LLM のハルシネーションによる事実ミスを防ぐ (プレビュー) | Amazon Web Services ブログ

Amazon Bedrock Guardrailsに新たに追加された自動推論チェックにより、生成AIの応答の正確性を数学的に検証し、ハルシネーションによる事実の誤りを防ぐことが可能になります。この機能は、組織のルールを構造化された数学形式にエンコードし、生成されたコンテンツがガイドラインに一致しているかを確認します。

LLMを悩ませる"Excel文書"をうまく扱う方法

Excel文書の解析には、openpyxlを使用したテキスト抽出、PDF変換による視覚情報の解析、ページ区切りの設定が重要です。製造業向けのRAGを活用し、情報抽出の精度向上に取り組んでいます。

「Agentless」という最新手法。LLMの新しい使い方。

「Agentless」は、特定の用途に特化したLLMの使用を提案し、エージェントを使わずにソフトウェア開発の自動化を実現する新手法。問題解決のための3ステップ(絞り込み、修正、検証)を通じて、コスト効率と性能の向上を図る。

プログラミング支援

Googleが自律的プログラミングAIエージェント「Jules」を発表。Gemini 2.0で実装計画を作成、コード生成・変更・バグフィクスなど実行 | テクノエッジ TechnoEdge

Googleが自律的プログラミングAIエージェント「Jules」を発表。Gemini 2.0を利用し、タスクに基づいてコード生成や変更、バグフィクスを実行。2025年にデベロッパー向けに提供予定。現在はPythonとJavaScriptに対応。ウェイティングリスト登録が開始。

Cognition | Devin is now generally available

Devinが一般提供開始、月額500ドルで無制限の利用が可能。Slack統合やIDE拡張機能を利用し、小規模なバグ修正や初稿PR作成に最適。オープンソースリポジトリへの貢献例も紹介。

Googleのエンジニアが語るAI支援コーディングの「70%問題」、AIが生産性を爆上げしたのになぜ製品は改善されない? - GIGAZINE

AI支援コーディングは経験豊富なエンジニアにとって有用だが、初心者は70%の成果を得た後の30%で苦労しがち。AIを効果的に活用するには、生成されたコードをしっかり確認し、エンジニアリング基準を維持することが重要。より良いソフトウェア構築が目標であるべき。

モダンデータスタック

Amazon SageMaker Unified Studio の構成や仕組みをまとめてみた #AWSreInvent | DevelopersIO

Amazon SageMaker Unified Studioは、機械学習開発のための統合環境で、データ分析からモデル開発までをサポート。Lakehouseとデータガバナンス機能を提供し、AWSサービスとのシームレスな統合が特徴。プロジェクト管理は無料で利用可能。実際に触れて理解を深めることを推奨。

ローコード・ノーコード

AWS App Studioを使用して生成AIを活用したアプリケーション構築 | DevelopersIO

AWS App Studioを使用して生成AIを活用したアプリケーションの作成方法を紹介。セットアップやアプリ生成の手順、IAMロールの設定、コネクタの作成を経て、公開までの流れを説明。ただし、Automationsセクションで動作に問題があったことも指摘。

量子コンピュータ

スパコンで10の25乗年もかかる計算をわずか5分で実行できる量子チップ「Willow」をGoogleが発表 - GIGAZINE

Googleの量子チップ「Willow」は105量子ビットを搭載し、エラー訂正を大幅に改善し、従来のスーパーコンピュータで1025年かかる計算を5分未満で実行可能に。量子コンピューティングの実用化に向けた重要な進展と期待されている。