ランキング(注目度スコア)
スコア算出日: 2026-06-21
合計スコア = √(HF Upvotes) + √(GitHub Stars) + cvFactor + venueBonus(HF・Stars が 0 のとき各 √ 項は 0、cvFactor は LLM による 100 点満点、venueBonus は学会採択加点)(算定方法の詳細)
2022年 注目論文ランキング
Spatial Computing Weekly の創刊にあたり、コンピュータビジョンと3D再構築の歴史において極めて重要な転換点となった「2022年」を遡及調査しました。
2022年は、Neural Radiance Fields (NeRF) が爆発的な進化を遂げ、単なる「見た目の再現」から、「動的なシーンへの対応」「物理ベースのライティング」「モバイルデバイスへの実装」といった、より実用的かつ高度な空間認識へとパラダイムが移行した年でした。本レポートでは、膨大な論文群の中から、技術的インパクトとコミュニティへの貢献度(GitHub Stars等)に基づき、厳選した20報をお届けします。
トップ5の深掘り
【第1位】Text2Light: Zero-Shot Text-Driven HDR Panorama Generation
- 概要: テキスト入力から、高品質な高ダイナミックレンジ(HDR)パノラマ画像をゼロショットで生成するモデルです。
- 新規性: 従来の生成モデルでは困難だった、複雑なシーンにおけるフォトリアルなライティングと360度反射の制御を、テキストによる直感的な操作で実現しました。
- なぜ選ばれたか: 合計スコア132.04(cvFactor 92 / venueBonus 15 / GitHub Star: 627)を記録。最高峰の学会であるSIGGRAPH 2022に採択され、グラフィックス分野への実用的なインパクトが極めて高いと評価されました。
- 関連リンク: arXiv | Hugging Face | GitHub
【第2位】PETR: Position Embedding Transformation for Multi-View 3D Object Detection
- 概要: マルチビュー画像を用いた3D物体検出において、位置情報のエンコーディングを革新する手法です。
- 新規性: 3D座標情報を画像特徴量へと変換する「Position Embedding Transformation (PETR)」を導入し、エンドツーエンドでの高精度な3D検出を可能にしました。
- なぜ選ばれたか: 合計スコア127.59(cvFactor 80 / venueBonus 15 / GitHub Star: 1062)を獲得。ECCV 2022での採択に加え、nuScenesベンチマークで1位を記録した実力派の論文です。
- 関連リンク: arXiv | Hugging Face | GitHub
【第3位】NeROIC: Neural Rendering of Objects from Online Image Collections
- 概要: インターネット上の多様な画像コレクションから、物体の高精度な形状と質感(Material)を再構築する手法です。
- 新規性: 異なるカメラ、照明、背景を持つ「野外(in-the-wild)」の画像から、NeRFを拡張したマルチステージ・アプローチを用いて高品質な物体表現を獲得します。
- なぜ選ばれたか: 合計スコア124.80(cvFactor 78 / venueBonus 15 / GitHub Star: 1011)。SIGGRAPH 2022にて、物体中心のレンダリングにおける新たな可能性を示しました。
- 関連リンク: arXiv | Hugging Face | GitHub
【第4位】MobileNeRF: Exploiting the Polygon Rasterization Pipeline for Efficient Neural Field Rendering on Mobile Architectures
- 概要: NeRFのレンダリングをモバイルデバイスで高速に行うための、ポリゴンラスタライズを用いた手法です。
- 新規性: 計算負荷の高いボリュームレンダリング(Ray Marching)を避け、テクスチャ付きポリゴンとしてNeRFを表現することで、標準的なグラフィックス・パイプラインでの高速描画を実現しました。
- なぜ選ばれたか: 合計スコア124.17(cvFactor 88 / venueBonus 15 / GitHub Star: 407)。CVPR 2023に採択されるなど、実用的なエッジコンピューティングへの貢献が非常に高いです。
- 関連リンク: arXiv | Hugging Face | GitHub
【第5位】MonoDETR: Depth-guided Transformer for Monocular 3D Object Detection
- 概要: 単眼カメラ画像から3D物体検出を行うための、深度ガイド付きTransformerフレームワークです。
- 新規性: 局所的な視覚特徴だけでなく、深度情報を活用することでシーン全体の3D空間構造や物体間の距離関係を捉えることに成功しました。
- なぜ選ばれたか: 合計スコア124.07(cvFactor 88 / venueBonus 15 / GitHub Star: 444)。自動運転における単眼カメラの限界に挑んだICCV 2023採択論文です。
- 関連リンク: arXiv | Hugging Face | GitHub
第6位〜第20位 クイックレビュー
【第6位】SC-DepthV3: Robust Self-supervised Monocular Depth Estimation for Dynamic Scenes 動的なシーンにおける自己教師あり単眼深度推定の堅牢性を向上させた研究です。 関連リンク: arXiv | Hugging Face | GitHub
【第7位】DynIBaR: Neural Dynamic Image-Based Rendering 動的なシーンにおけるニューラルな画像ベースレンダリング(IBR)の新しいアプローチを提案しています。 関連リンク: arXiv | Hugging Face | GitHub
【第8位】SceneRF: Self-Supervised Monocular 3D Scene Reconstruction with Radiance Fields 単眼画像を用いた自己教師ありの3Dシーン再構築をRadiance Fieldsを用いて実現します。 関連リンク: arXiv | Hugging Face | GitHub
【第9位】Neural 3D Scene Reconstruction with the Manhattan-world Assumption マンハッタン・ワールド仮定(垂直・水平な壁の構造)を利用した、効率的なニューラル3Dシーン再構築手法です。 関連リンク: arXiv | Hugging Face | GitHub
【第10位】Shape, Pose, and Appearance from a Single Image via Bootstrapped Radiance Field Inversion 単一の画像から形状、姿勢、外観を同時に推定するRadiance Field反転技術です。 関連リンク: arXiv | Hugging Face | GitHub
【第11位】SimpleRecon: 3D Reconstruction Without 3D Convolutions 3D畳み込みを用いずに、効率的に高品質な3D再構築を行う革新的な手法です。 関連リンク: arXiv | Hugging Face | GitHub
【第12位】MonoSDF: Exploring Monocular Geometric Cues for Neural Implicit Surface Reconstruction 単眼の幾何学的ヒントを活用し、ニューラル陰関数による表面再構築精度を高める手法です。 関連リンク: arXiv | Hugging Face | GitHub
【第13位】Layered Depth Refinement with Mask Guidance マスク情報を用いて層状の深度を洗練させ、精密な再構築を行う手法です。 関連リンク: arXiv | Hugging Face | GitHub
【第14位】Unifying Flow, Stereo and Depth Estimation オプティカルフロー、ステレオマッチング、深度推定を一つのフレームワークで統合する試みです。 関連リンク: arXiv | Hugging Face
【第15位】AutoRF: Learning 3D Object Radiance Fields from Single View Observations 単一視点の観察から、物体のRadiance Fieldを自動的に学習する手法です。 関連リンク: arXiv | Hugging Face | GitHub
【第16位】Reconstructing Hand-Held Objects from Monocular Video 手持ちカメラによる単眼動画から、物体を安定して再構築する技術です。 関連リンク: arXiv | Hugging Face
【第17位】NeRFPlayer: A Streamable Dynamic Scene Representation with Decomposed Neural Radiance Fields ストリーミング可能な、分解されたNeRFを用いた動的シーン表現手法です。 関連リンク: arXiv | Hugging Face | GitHub
【第18位】Progressively-connected Light Field Network for Efficient View Synthesis 効率的な視点合成のために、段階的に接続されるライトフィールド・ネットワークを提案しています。 関連リンク: arXiv | Hugging Face
【第19位】Physics-based Indirect Illumination for Inverse Rendering インバースレンダリングにおける、物理ベースの間接照明推定手法です。 関連リンク: arXiv | Hugging Face
【第20位】SelfNeRF: Fast Training NeRF for Human from Monocular Self-rotating Video 単眼の自己回転動画から、人物のNeRFを高速に学習する手法です。 関連リンク: arXiv | Hugging Face
編集後記
2022年の調査を通じて、3D再構築が「静的な点群の生成」から、「意味理解を伴う動的・物理的な空間表現」へと完全にシフトしたことが鮮明になりました。特にNeRFの進化は、コンピュータグラフィックスとコンピュータビジョンの境界を曖昧にするほど強力です。
Spatial Computing Weekly では、今後もこうした最先端の知見を迅速に整理し、技術者や研究者の皆様へお届けしてまいります。次回の週刊ランキングでは、さらに深掘りしたトピックをお届けする予定です。お楽しみに!