2024-12-23 Topics
2024-12-23 Topics
AIユースケース
Clio: Privacy-preserving insights into real-world AI use \ Anthropic
- Tags: AIユースケース,論文
- URL: https://www.anthropic.com/research/clio
Clioは、プライバシーを保護しながらAIモデルの使用状況を分析するツールで、ユーザーのデータを守りつつ、実際の利用方法や安全性の向上に役立てています。主な利用ケースには、コーディング、教育、ビジネス戦略が含まれ、クラスター分析により不正行為の特定や安全対策の強化が行われています。
AWS
週刊生成AI with AWS – 2024/12/16週 | Amazon Web Services ブログ
- Tags: AWS,アップデート情報
- URL: https://aws.amazon.com/jp/blogs/news/weekly-genai-20241216/
AWSの新しい生成AI関連のセミナー資料やブログ記事が公開され、シスラボの事例ではAmazon Bedrock Agentsを活用して市場調査の時間を98.3%削減したことが紹介されています。また、Amazon ConnectやQuickSightの新機能、データセキュリティに関する情報も提供されています。年内の投稿はこれで最後となり、来年のさらなる発展が期待されています。
週刊AWS – 2024/12/16週 | Amazon Web Services ブログ
- Tags: AWS,アップデート情報
- URL: https://aws.amazon.com/jp/blogs/news/aws-weekly-20241216/
今週のAWSの主なアップデートには、AWS IoT Greengrassの軽量ランタイム、Amazon Connectのエージェントスケジュールデータの分析提供、AWS Backupのアイテムレベルリカバリ機能、AWS GlueのApache Icebergテーブルの最適化、Amazon QuickSightのユニークキー機能などが含まれています。
CV
Updates to Veo, Imagen and VideoFX, plus introducing Whisk in Google Labs
- Tags: CV,Google
- URL: https://blog.google/technology/google-labs/video-image-generation-update-december-2024/
新しい動画生成モデルVeo 2とImagen 3が発表され、YouTubeクリエイターや企業がこれらの技術を活用している。Veo 2は高品質な動画を生成し、リアルな物理理解と人間の動きを反映。安全性と責任ある開発に配慮しつつ、AI生成物にはSynthIDウォーターマークが付与される。
DX事例
「事例が多過ぎて目当てのものを見つけにくい問題」を解決する、DX特化型データベースを公開 IPA:100以上のDX事例を閲覧可能 - @IT
- Tags: 事例紹介
- URL: https://atmarkit.itmedia.co.jp/ait/articles/2412/18/news069.html
情報処理推進機構(IPA)が「デジタル事例データベース」を公開し、業種や事業規模で条件を絞り込んでDX事例を効率的に検索できるようになった。会員登録をすると全ての事例が閲覧可能。
HPC
AWS ParallelCluster 3.12.0 がリリースされました | DevelopersIO
- Tags: HPC,AWS,アップデート情報
- URL: https://dev.classmethod.jp/articles/aws-parallelcluster-v3120-released/
AWS ParallelCluster 3.12.0がリリースされ、AMI作成機能の強化、ログエクスポートの簡素化、slurmctldの自動再起動が実装され、運用性が向上しました。
LLM
UGI Leaderboard - a Hugging Face Space by DontPlanToEnd
- Tags: 評価手法,LLM
- URL: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
UGI Leaderboardは、Hugging Faceのスペースで、LLMと評価手法に関する情報を提供しています。公開されており、URLはhttps://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboardです。
OpenAI、生成AI基盤新モデル「o3」開発 数学・コード生成が上達 - 日本経済新聞
- Tags: LLM,OpenAI,アップデート情報
- URL: https://www.nikkei.com/article/DGXZQOGN20EY20Q4A221C2000000/
オープンAIは新しい生成AI基盤モデル「o3」を開発し、2025年1月から一般提供を開始する。数学の問題解決やプログラミングコード生成の能力が向上し、性能を抑えた「o3-mini」も開発中。
OpenAIの「12 Days」まとめ - ITmedia NEWS
- Tags: LLM,OpenAI,アップデート情報
- URL: https://www.itmedia.co.jp/news/articles/2412/21/news083.html
OpenAIの「12 Days of OpenAI」イベントで、推論AI「o1」や新プラン「ChatGPT Pro」、AI動画生成モデル「Sora」、音声機能の追加、Web検索機能の無料提供など12の発表が行われた。最終日には新推論モデル「o3」と「o3-mini」のプレビューが発表された。
‘Gemini 2.0 Flash Thinking’ is Google’s first reasoning model
- Tags: LLM,ReasoningModel,Google
- URL: https://9to5google.com/2024/12/19/gemini-2-0-flash-thinking/
Googleが新しい「Gemini 2.0 Flash Thinking」モデルを発表し、複雑な問題を解決するために思考過程を明示化する。物理学や確率のデモを通じて強力な推論性能を示し、AIスタジオで利用可能。全カテゴリーでチャットボットアリーナのリーダーボードで1位を獲得。
Finally, a Replacement for BERT: Introducing ModernBERT
- Tags: LLM
- URL: https://huggingface.co/blog/modernbert
ModernBERTは、BERTの進化版であり、8192トークンのコンテキスト長を持ち、速度と精度を向上させたエンコーダモデルです。コード理解や長文検索に特化しており、従来のモデルよりも効率的で、さまざまなアプリケーションに対応可能です。
arXivから2024年のLLMトレンド追ってみた
- Tags: サマリー,論文
- URL: https://zenn.dev/mkj/articles/329499f577c728
2024年のLLMに関するarXivの論文は16,503本で、マルチモーダル化や推論能力向上が進展。音声処理や医療応用への活用が活発化し、セキュリティや社会的影響に関する研究も重要視されている。
LLMOps
ランダムな文字列で質問し続けるとAIから有害な回答を引き出せるという攻撃手法「Best-of-N Jailbreaking」が開発される、GPT-4oを89%の確率で突破可能
- Tags: LLMOps,ITセキュリティ
- URL: https://gigazine.net/news/20241223-ai-best-of-n-jailbreaking/
「Best-of-Nジェイルブレイキング」は、プロンプトの文字を混ぜたり、スペルミスをすることでAIから有害な回答を引き出す手法で、GPT-4oでは89%の成功率を記録。試行回数が増えるほど成功率が高まり、他の攻撃手法との組み合わせで効果が向上することが確認された。
10億人のペルソナから構築された大規模データセット、Persona Hubが登場! | AI-SCHOLAR | AI:(人工知能)論文・技術情報メディア
- Tags: 学習手法,論文
- URL: https://ai-scholar.tech/articles/other/Persona-Hub
ペルソナ駆動のデータ合成手法を提案し、10億の多様なペルソナから構成されるPersona Hubを構築。さまざまな実用例を示し、合成データの多様性を向上させる可能性を探る。
OpenAI o1 and new tools for developers | OpenAI
- Tags: OpenAI,アップデート情報,LLMOps
- URL: https://openai.com/index/o1-and-new-tools-for-developers/
OpenAI o1の導入により、開発者向けにリアルタイムAPIの改善、新しいファインチューニング手法、GoおよびJavaのSDKが発表され、パフォーマンスとコスト効率が向上しました。特に、o1は複雑なタスクを高精度で処理できるモデルです。
シミュレーション
現実世界より43万倍も高速にシミュレートされた世界でロボットを訓練できるオープンソース生成物理エンジン「Genesis」 - GIGAZINE
- Tags: フレームワーク,シミュレーション,世界モデル
- URL: https://gigazine.net/news/20241220-physical-engine-genesis
カーネギーメロン大学の研究チームが、現実の43万倍の速さでロボットを訓練できるオープンソースの物理シミュレーションプラットフォーム「Genesis」を発表。Pythonベースで自然言語による世界生成が可能で、効率的なGPU計算を活用し、ロボット工学の研究を加速させることを目指している。
💡 What is Genesis — Genesis 0.2.0 documentation
- Tags: フレームワーク,シミュレーション,世界モデル
- URL: https://genesis-world.readthedocs.io/en/latest/user_guide/overview/what_is_genesis.html
Genesisは、ロボティクスや物理AIのための汎用物理プラットフォームで、ユニバーサル物理エンジン、軽量なロボットシミュレーション、フォトリアルなレンダリング、自然言語からデータを生成するエンジンを提供します。物理シミュレーションの利用を容易にし、データ生成を自動化することを目指しています。
テスト手法
PlaywrightとPercyで始めるAI活用Visual Regression Testing入門 | DevelopersIO
- Tags: テスト手法,フレームワーク
- URL: https://dev.classmethod.jp/articles/visual-regression-testing-with-playwright-and-percy/
PlaywrightとPercyを使用したVisual Regression Testingにより、UIの変更を自動検出し、異なるデバイスでの表示確認を効率化。テスト環境の設定や実装方法を解説し、意図しない変更を早期に発見する手法を紹介。
プロジェクト管理
プロジェクトの成功とは一体何か、腕利きのベテランから意見が相次ぐ | 日経クロステック(xTECH)
- Tags: プロジェクト管理
- URL: https://xtech.nikkei.com/atcl/nxt/column/18/00166/121600165/
プロジェクトの成功は、労力と費用に見合う価値を提供することとされ、品質や予算超過が問題視されない場合もある。成功の評価は難しく、実際の利用状況や指標設定が重要であると多くの専門家が意見を述べている。
ウォーターフォールの反省とアジャイルの成功に必要なもの #SIer - Qiita
- Tags: プロジェクト管理,DevOps
- URL: https://qiita.com/swiri/items/be7703dd0b204c4c2ae0
アジャイル開発はウォーターフォールの問題を解決するための手法ではなく、根本的な原因は請負契約にある。内製化、マインドチェンジ、組織改革が成功には必要であり、競争力を高めるためには内製化が不可欠である。
モダンデータスタック
Amazon S3 Tables と Iceberg Tables on Amazon S3 のパフォーマンス比較 #AWSreInvent | DevelopersIO
- Tags: モダンデータスタック,AWS,アップデート情報
- URL: https://dev.classmethod.jp/articles/amazon-s3-tables-performance-reinvent2024/
Amazon S3 Tablesはクエリパフォーマンスが最大3倍向上し、トランザクション数が最大10倍増加するが、一般的な分析クエリではIceberg Tablesの方が優位性を示す結果となった。今後のアップデートに期待が寄せられる。
SageMaker Unified Studio を使うときには VPC エンドポイントに注意しよう | DevelopersIO
- Tags: AWS,データエンジニアリング,モダンデータスタック
- URL: https://dev.classmethod.jp/articles/vpc-sagemaker-unified-studio/
SageMaker Unified Studioの使用時に、CloudFormationテンプレートによって81個のVPCエンドポイントが作成され、意図せずコストが発生する可能性がある。VPCエンドポイントを使用しない場合は、
[レポート]BUILD TOKYO ONLINE:Snowflakeの生成AIで実現する社内データ活用促進への道筋 | DevelopersIO
- Tags: Snowflake,モダンデータスタック,LLMOps
- URL: https://dev.classmethod.jp/articles/build-tokyo-online-snowflake-gen-ai/
Snowflakeの生成AIは、ビジネスユーザーとデータチームの橋渡しをし、セルフサービス分析を可能にするCortex Analystを提供。新機能としてJOINサポートや連続会話が追加され、信頼性の高いデータ活用を促進する。試してみる価値あり。
時系列予測
追加学習なしの zero-shot で高精度な時系列予測 : Chronos-Bolt を AutoGluon で利用する | Amazon Web Services ブログ
- Tags: 時系列予測,AWS
- URL: https://aws.amazon.com/jp/blogs/news/machine-learning-fast-and-accurate-zero-shot-forecasting-with-chronos-bolt-and-autogluon/
Chronos-BoltはAutoGluon-TimeSeriesの新機能で、追加学習なしで最大250倍高速かつ高精度な時系列予測を実現。これにより、業界全体でのビジネス決定が簡素化され、外部情報を活用した予測精度の向上も可能になる。ユーザーは簡単にモデルを構築・デプロイできる。