Papers

Filter by company

Logics-Parsing-Omni Technical Report

Alibaba

Published on: 2026-03-10 25 authors
CLIPO: Contrastive Learning in Policy Optimization Generalizes RLVR

Alibaba / Chinese Academy of Sciences

Published on: 2026-03-10 9 authors
Foley-Flow: Coordinated Video-to-Audio Generation with Masked Audio-Visual Alignment and Dynamic Conditional Flows

Alibaba / Hupan Laboratory

Published on: 2026-03-09 2 authors
Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective

Alibaba / Shanghai Jiao Tong University

Published on: 2026-03-09 10 authors
SecAgent: Efficient Mobile GUI Agent with Semantic Context

Alibaba

Published on: 2026-03-09 10 authors
Reference-guided Policy Optimization for Molecular Optimization via LLM Reasoning

Alibaba / Central Michigan University, DAMO Academy, Hong Kong Baptist University, Shanghai Jiao Tong University

Published on: 2026-03-06 7 authors
Efficient Vector Search in the Wild: One Model for Multi-K Queries

Alibaba / Boston University, Shanghai Jiao Tong University

Published on: 2026-03-06 10 authors
Making Training-Free Diffusion Segmentors Scale with the Generative Power

Alibaba / Chinese Academy of Sciences, Sun Yat-sen University, University of Chinese Academy of Sciences

Published on: 2026-03-06 6 authors
On the Generalization Capacities of MLLMs for Spatial Intelligence

Alibaba / HuPan Lab, Nanyang Technological University

Published on: 2026-03-05 7 authors
Beyond Scattered Acceptance: Fast and Coherent Inference for DLMs via Longest Stable Prefixes

Alibaba / Tsinghua University

Published on: 2026-03-05 5 authors
SWE-CI: Evaluating Agent Capabilities in Maintaining Codebases via Continuous Integration

Alibaba / Sun Yat-sen University

Published on: 2026-03-04 5 authors
SSKG Hub: An Expert-Guided Platform for LLM-Empowered Sustainability Standards Knowledge Graphs

Alibaba

Published on: 2026-02-28 1 author
DeepPlanning: Benchmarking Long-Horizon Agentic Planning with Complex Real-World Tasks

Alibaba

Published on: 2026-02-01 9 authors
Extracting books from production language models

Alibaba / School of Cyber Science and Engineering, Wuhan University

Published on: 2026-01-06 4 authors
Seeing, Listening, Remembering, and Reasoning: A Multimodal Agent with Long-Term Memory

Alibaba / Zhejiang University

Published on: 2025-10-09 1 author
Tongyi DeepResearch Technical Report

Alibaba

Published on: 2025-10-04 1 author
Robix: A Unified Model for Robot Interaction, Reasoning and Planning

Alibaba

Published on: 2025-09-11 1 author
Seed-Prover: Deep and Broad Reasoning for Automated Theorem Proving

Alibaba

Published on: 2025-07-31 1 author
Qwen3 Technical Report

Alibaba

Published on: 2025-05-14 1 author
Alibaba LingmaAgent: Improving Automated Issue Resolution via Comprehensive Repository Exploration

Alibaba

Published on: 2025-03-26 1 author
Qwen2.5-Omni Technical Report

Alibaba

Published on: 2025-03-26 1 author
Qwen2.5-VL Technical Report

Alibaba

Published on: 2025-02-19 1 author
Qwen2.5 Technical Report

Alibaba

Published on: 2024-12-19 1 author
Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any Resolution

Alibaba

Published on: 2024-10-03 1 author
Qwen2-Audio Technical Report

Alibaba

Published on: 2024-07-15 1 author
Qwen2 Technical Report

Alibaba

Published on: 2024-07-15 1 author
mPLUG-Owl : Modularization Empowers Large Language Models with Multimodality

Alibaba

Published on: 2024-03-29 1 author
Qwen-VL: A Versatile Vision-Language Model for Understanding, Localization, Text Reading, and Beyond

Alibaba

Published on: 2023-10-13 1 author
mPLUG-Owl2: Revolutionizing Multi-modal Large Language Model with Modality Collaboration

Alibaba

Published on: 2023-10-09 1 author
Qwen Technical Report

Alibaba

Published on: 2023-09-28 4 authors
DAMO-YOLO : A Report on Real-Time Object Detection Design

Alibaba

Published on: 2023-04-24
VECO 2.0: Cross-lingual Language Model Pre-training with Multi-granularity Contrastive Learning

Alibaba

Published on: 2023-04-17 1 author
mPLUG-2: A Modularized Multi-modal Foundation Model Across Text, Image and Video

Alibaba

Published on: 2023-02-01
Prompt Tuning for Generative Multimodal Pretrained Models

Alibaba

Published on: 2022-08-04 1 author
mPLUG: Effective and Efficient Vision-Language Learning by Cross-modal Skip-connections

Alibaba

Published on: 2022-05-25 1 author
M6-Rec: Generative Pretrained Language Models are Open-Ended Recommender Systems

Alibaba

Published on: 2022-05-19 1 author
ML-Decoder: Scalable and Versatile Classification Head

Alibaba

Published on: 2021-12-31 1 author
M6: A Chinese Multimodal Pretrainer

Alibaba / Tsinghua University

Published on: 2021-05-29 1 author
StructBERT: Incorporating Language Structures into Pre-training for Deep Language Understanding

Alibaba

Published on: 2019-08-13 1 author

Go to section

Search

Papers

Help

People also viewed

Create AI Tools

Mini Tool

Vibe code an AI Tool

Choose listing type: