NVIDIA、Eagle 2.5 ビジュアル言語モデルをリリース:80億のパラメータで GPT-4o を上回る

NVIDIA、Eagle 2.5 ビジュアル言語モデルをリリース:80億のパラメータで GPT-4o を上回る


NVIDIAは先日、新しい視覚言語モデル「Eagle 2.5」をリリースしました。わずか80億のパラメータを持つこのAIは、長時間動画理解の分野において画期的な進歩を遂げました。Video-MMEベンチマークテスト(入力フレーム数512)において72.4%の精度を達成し、その性能はQwen2.5-VL-72Bといった大規模なパラメータを持つ競合製品に匹敵します。

Eagle 2.5の中核となるのは、2つの革新的な技術です。情報優先サンプリング、画像領域保存技術により、元画像の有効情報保存率が60%以上に向上します。また、自動ダウンサンプリングシステムは、コンテキストに応じて画像とテキスト入力の比率を動的に調整できます。さらに、段階的な学習後処理戦略により、コンテキストウィンドウを32Kから128Kに拡張することで、モデルは徐々に適応し、特定のデータ長へのオーバーフィッティングを回避します。

長時間動画の理解をサポートするために、NVIDIAは専用のEagle-Video-110Kデータセットを構築しました。このデータセットは、二重アノテーションメカニズムを採用しています。GPT-4によって生成された章レベルのストーリー記述と、GPT-4oによってアノテーションされたフラグメントレベルの質問と回答のペアの両方が含まれており、コサイン類似度スクリーニングによってデータの多様性が確保されています。長時間動画タスクでは、128フレーム以上のコンテンツに対するモデルの理解精度が23%向上しました。

パフォーマンステストでは、Eagle 2.5はMVBench動画理解テストで74.8ポイントを獲得し、前バージョンから18%の向上を達成しました。DocVQA文書画像分析テストでは、94.1%の精度で業界新記録を樹立しました。アブレーション実験では、増分トレーニングを削除すると長時間動画タスクのパフォーマンスが12%低下し、情報優先サンプリングをキャンセルすると画像詳細認識率が9%低下することが確認されました。

現在、このモデルはSigLIPビジュアルエンコーダーを統合し、4K解像度の画像処理をサポートしています。実車故障検出テストでは、3分間のドライブレコーダー映像からターボチャージャーの異常振動の兆候を検出することに成功し、応答速度は従来のソリューションの3倍に高速化しました。

NVIDIAは、Eagle 2.5テクノロジーが主に医療画像解析や産業品質検査の分野で活用されることを発表しました。軽量設計により、エッジデバイスへの導入が可能です。RTX 4090グラフィックスカード1枚で、毎秒45フレームのリアルタイム映像解析が可能です。開発キットは6月にパートナー向けにテスト用に提供される予定です。

人気の7-Zip圧縮ソフトウェアに発見された2つの危険なハッカーの脆弱性

サイバーセキュリティの専門家たちは、7-zipのコードに2つの深刻な脆弱性を発見しました。これらの脆弱性により、攻撃者はユーザーの知らないうちにzipファイルを処理して

人気の7-Zip圧縮ソフトウェアに発見された2つの危険なハッカーの脆弱性

小米は新しいカメラモジュールでスマートドアロックをアップグレードしました。

xiaomiは、スマートドアロックの新しいバージョンである「smart door lock 4 pro dual camera edition」を発売しました。主な特徴は、ビデオインターコムモードで視認性を

小米は新しいカメラモジュールでスマートドアロックをアップグレードしました。

ブラックシャークは、世界初のアクティブ熱調整機能を搭載したマウスを発表しました。

ゲームブランドのblack sharkは、非常にユニークなワイヤレスマウスを製品ラインに追加しました。それがstarlight cooling and heating gaming mouseです。従来のゲーミン

ブラックシャークは、世界初のアクティブ熱調整機能を搭載したマウスを発表しました。

コントロールを取る。iPhone、iPad、Apple Vision Proに近日公開予定

2019年初め、ほとんどの人はミステリーアクションゲーム「control」がremedy entertainmentの代表作になるとは想像できませんでした。remedy entertainmentはこれまでに「m

コントロールを取る。iPhone、iPad、Apple Vision Proに近日公開予定

アップルはVision Airヘッドフォンに代わるスマートグラスを発売する予定です。

ブルームバーグのジャーナリスト、マーク・グルマン氏は、アップルはライトウェイトのvision pro xrヘッドセットを放棄し、スマートグラスの開発に注力すると主張していま

アップルはVision Airヘッドフォンに代わるスマートグラスを発売する予定です。

イノコンがGA32V1Mデュアルモード4Kゲーミングモニターを発表

中国のinnocn社は、ゲーマー向けの新しいga32v1mモニターを発表しました。このモニターは、映画やeスポーツのタイトルに応じて、2つの異なる解像度とリフレッシュレートの

イノコンがGA32V1Mデュアルモード4Kゲーミングモニターを発表

Vivo X300とX300 Proは、発売前に完全に発表されました。

vivo x300とx300 proスマートフォンのプライベート発売イベントで撮影されたとされる写真がオンラインで流出しました。これらの写真は、本日発売予定の2つの新製品のすべ

Vivo X300とX300 Proは、発売前に完全に発表されました。

サムスンW26発表:折りたたみ式Galaxy Z Fold7のプレミアムバージョン

サムスンは、中国市場向けのgalaxy z fold7の特別エディションであるsamsung w26フリップフォンを発売しました。新モデルは、デザインとストレージ構成の両方でオリジナル

サムスンW26発表:折りたたみ式Galaxy Z Fold7のプレミアムバージョン

スイッチボットセーフティアラームキーチェーンは、トラッカー、懐中電灯、アラーム機能を組み合わせた製品です。

スイッチボットは緊急時に役立つガジェットを発売しました。これは、1人で散歩したり、深夜に帰宅したりする際など、安全性を高めるように設計されています。スイッチボッ

スイッチボットセーフティアラームキーチェーンは、トラッカー、懐中電灯、アラーム機能を組み合わせた製品です。

ミュージックカムヘッドフォンは、ヘッドフォンとアクションカメラを一体化したものです。

キックスターターでユニークなヘッドセット「musiccam」が発売されました。このオールインワンのカメラとヘッドセットで、第一人称視点でさまざまなシーンを撮影できます。

ミュージックカムヘッドフォンは、ヘッドフォンとアクションカメラを一体化したものです。

竹製プラスチックは通常のプラスチックよりも強く、環境に優しい素材です。

中国のハルビンにある東北林業大学の研究者たちは、従来のプラスチックのすべての利点を保持した竹をベースにした材料を開発しました。従来のポリマーとは異なり、この材料

竹製プラスチックは通常のプラスチックよりも強く、環境に優しい素材です。

ロシアは熱絶縁性を備えたスマートブリックを開発しています。

ウラル連邦大学の専門家たちは、中国の遼寧工業大学の同僚と協力して、新世代の複合ブリックを開発しました。この革新的な技術は、従来のブリックと比較して、室内の熱損失

ロシアは熱絶縁性を備えたスマートブリックを開発しています。

公式レンダリングでHonor Watch 5 Proスマートウォッチの仕様が明らかにされた。

発売直前に、honorはその新しいwatch 5 proスマートウォッチについて新しい詳細を発表しました。同社はオンラインで一連のプロモーション資料を公開し、デバイスの主な仕様

公式レンダリングでHonor Watch 5 Proスマートウォッチの仕様が明らかにされた。

ブラックベリーのスマートフォンは1年以内に再発売される予定です。

物理キーボードを搭載したblackberry端末は長い間「埋もれていた」と考えられていましたが、業界関係者のヨゲシュ・ブラール氏は、blackberryファンにとってすべてが失われ

ブラックベリーのスマートフォンは1年以内に再発売される予定です。

アンドロイド16をベースにしたLineageOS 23.0が100以上の古いスマートフォンにリリースされました。

カスタムファームウェア「lineageos」の開発者は、android 16をベースにした新しいバージョンをリリースしました。これにより、100を超える旧型スマートフォンモデルのユー

アンドロイド16をベースにしたLineageOS 23.0が100以上の古いスマートフォンにリリースされました。