Runtao Liu

LongVideoAgent: Multi-Agent Reasoning with Long Videos

R Liu, Z Liu, J Tang, Y Ma, R Pi, J Zhang, Q Chen

arXiv 2025, under review

Fake it till You Make it: Reward Modeling as Discriminative Prediction

R Liu, J Zhan, Y He, C Wei, Alan Yuille, Qifeng Chen

arXiv 2025, under review

VideoDPO: Omni-Preference Alignment for Video Diffusion Generation

R Liu, H Wu, Z Ziqiang, C Wei, Y He, R Pi, Qifeng Chen

CVPR 2025

AlignGuard: Scalable Safety Alignment for Text-to-Image Generation

R Liu, IC Chen, J Gu, J Zhang, R Pi, Q Chen, Philip Torr, Ashkan Khakzar, Fabio Pizzati

ICCV 2025

Utmath: Math evaluation with unit test via reasoning-to-coding thoughts

B Yang, Q Yang, Y Ma, R Liu

EMNLP 2025 Findings

I Think, Therefore I Diffuse: Enabling Multimodal In-Context Reasoning in Diffusion Models

Z Mi, KC Wang, G Qian, H Ye, R Liu, S Tulyakov, K Aberman, Dan Xu

ICML 2025 (Poster)

Strengthening Multimodal Large Language Model with Bootstrapped Preference Optimization

R Pi, T Han, W Xiong, J Zhang, R Liu, R Pan, Tong Zhang

ECCV 2024 (Oral)

Pointing to a Llama and Call it a Camel: On the Sycophancy of Multimodal Large Language Models

R Pi, K Miao, P Li, R Liu, J Gao, J Zhang, X Zhou

EMNLP 2025 Main

VL-GenRM: Enhancing Vision-Language Verification via Vision Experts and Iterative Training

J Zhang, K Miao, R Pi, Z Wang, R Liu, R Pan, Tong Zhang

arXiv 2025, under review

LLMs Meet Multimodal Generation and Editing: A Survey

Y. He, Z. Liu, J. Chen, Z. Tian, H. Liu, X. Chi, R Liu, ..., Qifeng Chen

arXiv 2024, in progress

Latent Guard: a Safety Framework for Text-to-image Generation

R Liu, A Khakzar, J Gu, Q Chen, Philip Torr, Fabio Pizzati

ECCV 2024 (Poster)

Unsupervised Sketch-to-Photo Synthesis

R Liu, Q Yu, Stella Yu

ECCV 2020 (Oral)

The Emergence of Objectness: Learning Zero-Shot Segmentation from Videos

R Liu, Z Wu, Stella Yu, Steve Lin

NeurIPS 2021

CLEVR-Ref+: Diagnosing Visual Reasoning with Referring Expressions

R Liu, C Liu, Y Bai, Alan Yuille

CVPR 2019

Automatic Document Metadata Extraction Based on Deep Networks

R Liu, L Gao, D An, Z Jiang, Z Tang

NLPCC 2017 (Oral)

ModelGrow: Continual Text-to-Video Pre-training with Model Expansion and Language Understanding Enhancement

Z Rao, L Ji, Y Xing, R Liu, Z Liu, J Xie, Z Peng, Y He, Qifeng Chen

arXiv 2024, under review

SketchInverter: Multi-Class Sketch-Based Image Generation via GAN Inversion

J Yu, Z An, R Liu, C Wang, Qian Yu

WACV 2023 (Poster)

3D Shape Reconstruction from Free-Hand Sketches

J Wang, J Lin, Q Yu, R Liu, Y Chen, Stella Yu

ECCV Workshop 2022

News

Research Experience

Selected Research

GenAI RL/Reasoning/Agent

Visual Generation and Understanding

Selected Awards