Papers

Filter by company

Learning Diverse Skills for Behavior Models with Mixture of Experts

Xiaomi

1 author
Utonia: Toward One Encoder for All Point Clouds

Xiaomi / The University of Hong Kong

Published on: 2026-03-03 1 author
LaST-VLA: Thinking in Latent Spatio-Temporal Space for Vision-Language-Action in Autonomous Driving

Xiaomi

Published on: 2026-03-02 1 author
EMO-R3: Reflective Reinforcement Learning for Emotional Reasoning in Multimodal Large Language Models

Xiaomi / Wuhan University

Published on: 2026-02-27 1 author
MSJoE: Jointly Evolving MLLM and Sampler for Efficient Long-Form Video Understanding

Xiaomi / Tongji University

Published on: 2026-02-26 1 author
ThinkOmni: Lifting Textual Reasoning to Omni-modal Scenarios via Guidance Decoding

Xiaomi / Huazhong University of Science and Technology

Published on: 2026-02-26 1 author
UFO: Unifying Feed-Forward and Optimization-based Methods for Large Driving Scene Modeling

Xiaomi / University of Illinois Urbana-Champaign

Published on: 2026-02-24 1 author
From Pairs to Sequences: Track-Aware Policy Gradients for Keypoint Detection

Xiaomi / Wuhan University

Published on: 2026-02-24 1 author
VGGDrive: Empowering Vision-Language Models with Cross-View Geometric Grounding for Autonomous Driving

Xiaomi / Tianjin University

Published on: 2026-02-24 1 author
Xiaomi-Robotics-0: An Open-Sourced Vision-Language-Action Model with Real-Time Execution

Xiaomi / Xiaomi Robotics

Published on: 2026-02-13 1 author
HAIC: Humanoid Agile Object Interaction Control via Dynamics-Aware World Model

Xiaomi / Tsinghua University

Published on: 2026-02-12 1 author
Federated Balanced Learning

Xiaomi

Published on: 2026-02-09 1 author
DriveWorld-VLA: Unified Latent-Space World Modeling with Vision-Language-Action for Autonomous Driving

Xiaomi

Published on: 2026-02-06 1 author
MindDrive: A Vision-Language-Action Model for Autonomous Driving via Online Reinforcement Learning

Xiaomi / Huazhong University of Science and Technology

Published on: 2026-02-05 1 author
From Chains to Graphs: Self-Structured Reasoning for General-Domain LLMs

Xiaomi / University of Tokyo

Published on: 2026-01-20 1 author
Pixel-Perfect Visual Geometry Estimation

Xiaomi

Published on: 2026-01-08 1 author
DriveLaW:Unifying Planning and Video Generation in a Latent Driving World

Xiaomi / Huazhong University of Science and Technology

Published on: 2025-12-31 1 author
Flow2GAN: Hybrid Flow Matching and GAN with Multi-Resolution Network for Few-step High-Fidelity Audio Generation

Xiaomi

Published on: 2025-12-29 1 author
GroundingME: Exposing the Visual Grounding Gap in MLLMs through Multi-Dimensional Evaluation

Xiaomi / The University of Hong Kong

Published on: 2025-12-19 1 author
DVGT: Driving Visual Geometry Transformer

Xiaomi / Tsinghua University

Published on: 2025-12-18 1 author

Search

Papers

Help

People also viewed

Create AI Tools

Mini Tool

Vibe code an AI Tool

Choose listing type: