2025-01-27 Topics

Page content

2025-01-27 Topics

AI/ML全般

データサイエンス系チートシートを網羅してみた #Python - Qiita

データサイエンスに関する多様なチートシートをまとめ、前処理、可視化、機械学習、深層学習、統計などの実践的な情報を提供。初心者から上級者まで役立つリソースを集約し、効率的な学習をサポートします。

AIエージェント

Computer-Using Agent | OpenAI

Computer-Using Agent (CUA) combines vision capabilities with reasoning to perform digital tasks through graphical user interfaces, achieving notable success rates in various environments. It prioritizes safety and is currently available for Pro Tier users in the U.S. for feedback and improvement.

AI経済

トランプ大統領、ソフトバンク・孫正義氏らとAI開発に78兆円投資表明 - 日本経済新聞

トランプ大統領は、ソフトバンクの孫正義氏やオープンAIのサム・アルトマンCEOと共に、米国のAI開発に78兆円の巨額投資を発表した。

AWS

週刊生成AI with AWS – 2025/1/20週 | Amazon Web Services ブログ

AWSの最新アップデートとして、生成AI技術を活用した新機能やブログ記事が多数公開され、特にAmazon Q DeveloperやAmplify AI Kitを用いたアプリケーション開発に関する情報が紹介されています。また、Amazon Bedrockの新しいモデルや機能も発表されました。

週刊AWS – 2025/1/20週 | Amazon Web Services ブログ

今週のAWSアップデートには、EventBridgeのクロスアカウントターゲットへの直接配信、Amazon Correttoのセキュリティ更新、CloudWatchによるAurora PostgreSQLの実行計画キャプチャ、EC2 i7Ieインスタンスの新規リージョン追加などが含まれています。

Azure

Weekly Azure アップデート情報 - 2025/1/21|クラウドテクノロジーブログ|ソフトバンク

Azure Confidential LedgerがSOC2 Type II認証を取得し、データセキュリティを強化。WebSocketサポートによりリアルタイムアプリのパフォーマンス向上、Azure Files HDDの新モデルで柔軟なストレージ管理が可能に。PostgreSQLのパフォーマンス管理が改善され、Azure Monitorでメトリック収集が簡素化。今後も定期的にAzure情報を提供予定。

Google Cloud

Weekly Google Cloud アップデート情報 - 2025/1/21|クラウドテクノロジーブログ|ソフトバンク

今週のGoogle Cloudアップデートでは、Vertex AI Searchの新機能やBigQuery MLの時系列予測機能、Cloud Composerの請求統合、VPC Flow Logsの一般提供開始などが紹介されています。さらに、Cloud Runでの複数コンテナデプロイが可能になりました。

LLM

DeepSeek-R1の論文読んだ?【勉強になるよ】

DeepSeek-R1は、強化学習とSFTを組み合わせて高性能なLLMを実現し、数学問題に対する思考能力を強化。ルールベース報酬を用いることで計算効率を向上させ、一般的なタスクにおける課題も解決を目指す。蒸留モデルも開発中。

大規模言語モデル PLaMo 2 のためのトークナイザ性能改善 - Preferred Networks Research & Development

PLaMo 2のトークナイザは、日本語のトークン効率を45%、英語を25%向上させ、学習コストを削減。形態素解析を取り入れ、LLMに適した分割ルールを採用し、性能劣化を防ぐ工夫がなされている。

[2501.09781] VideoWorld: Exploring Knowledge Learning from Unlabeled Videos

深層生成モデルVideoWorldは、ラベルなしのビデオデータから知識を学習し、ビデオベースのGoやロボット制御タスクでの能力をテスト。ビデオのみのトレーニングでルールや推論能力を学習し、視覚的変化の表現が重要。300百万パラメータのモデルで5段プロレベルに到達し、ロボットタスクでも多様な制御操作を学習。全てのコード、データ、モデルはオープンソース。

低コストで高性能なAIモデル、オープンソースで実現–開発コストは約7万円 - ZDNET Japan

NovaSkyの研究チームが開発したオープンソースの推論モデル「Sky-T1-32B-Preview」は、約7万円で19時間のトレーニングでOpenAIのo1-previewに匹敵する性能を持つ。これにより、小規模な研究機関でも手頃な価格で高度なAIモデルの開発が可能になる。オープンソースの進展はAIの民主化に寄与する可能性がある。

[2501.09038] Do generative video models learn physical principles from watching videos?

AI動画生成の進展に伴い、モデルが物理法則を学習するのか、単に視覚的リアリズムを達成するための高度なピクセル予測器であるのかを検証。Physics-IQベンチマークデータセットを用いた結果、現在のモデルは物理的理解が限られており、視覚的リアリズムとは無関係であることが示された。特定の物理原則を観察から学ぶ可能性はあるが、課題は依然として残る。

100倍速で実用的な文章ベクトルを作れる、日本語 StaticEmbedding モデルを公開 - A Day in the Life

StaticEmbeddingモデルは、CPU環境で126倍速く文章ベクトルを生成でき、情報検索や文章判別に利用可能。日本語モデルは実用的な性能を持ち、対照学習を用いて学習され、簡単に利用できる。次元削減も可能で、特定のタスクに応じた性能向上が期待される。

プログラミング支援

注目のAIエンジニア「Devin」を入れてみた!購入から初期設定まで | DevelopersIO

AIエンジニア「Devin」の購入と初期設定について、SlackやGitHubとの連携、サブスクリプションの詳細、タスクの依頼方法を紹介。管理者権限が必要で、実際のタスク依頼は今後の検証課題。

モダンデータスタック

[2025年1月22日号]個人的に気になったModern Data Stack情報まとめ | DevelopersIO

最近のModern Data Stack関連の情報をまとめ、Airbyteの新バージョンやOmnataのSalesforceコネクタの機能追加、dbt LabsのSDF Labs買収、Lookerの新機能などを紹介しています。