Homepage - Yutong Wang's Home Page

Education

Beijing Institute of Technology

M.S. in Computer Science Sep. 2022 - Jun. 2025
Beijing Institute of Technology

B.S. in Computer Science Sep. 2018 - Jun. 2022

Experience

Shanghai AI Lab

Research Intern Apr. 2025 - Now
Ant Group

Research Intern Apr. 2024 - Oct. 2024
VRC Inc.

Research Intern Jul. 2023 - Sep. 2023

Selected Publications (view all )

Weakly-Supervised Movie Trailer Generation Driven by Multi-Modal Semantic Consistency

Sidan Zhu, Yutong Wang, Hongteng Xu, Dixin Luo†(† corresponding author)

Proceedings of the 34th International Joint Conference on Artificial Intelligence, IJCAI 2025 Conference

[Demo]

Weakly-Supervised Movie Trailer Generation Driven by Multi-Modal Semantic Consistency

Sidan Zhu, Yutong Wang, Hongteng Xu, Dixin Luo†(† corresponding author)

Proceedings of the 34th International Joint Conference on Artificial Intelligence, IJCAI 2025 Conference

[Demo]

Efficient Video Face Enhancement with Enhanced Spatial-Temporal Consistency

Yutong Wang, Jiajie Teng, Jiajiong Cao, Yuming Li, Chenguang Ma, Hongteng Xu, Dixin Luo†(† corresponding author)

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, CVPR 2025 Conference

[Arxiv] [Code] [Page] [Cite]

Efficient Video Face Enhancement with Enhanced Spatial-Temporal Consistency

Yutong Wang, Jiajie Teng, Jiajiong Cao, Yuming Li, Chenguang Ma, Hongteng Xu, Dixin Luo†(† corresponding author)

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, CVPR 2025 Conference

[Arxiv] [Code] [Page] [Cite]

An Inverse Partial Optimal Transport Framework for Music-guided Movie Trailer Generation

Yutong Wang*, Sidan Zhu*, Hongteng Xu, Dixin Luo†(† corresponding author)

Proceedings of the 32th ACM International Conference on Multimedia, ACMMM 2024 Conference

[Arxiv] [Code] [Page] [Demo] [Cite]

An Inverse Partial Optimal Transport Framework for Music-guided Movie Trailer Generation

Yutong Wang*, Sidan Zhu*, Hongteng Xu, Dixin Luo†(† corresponding author)

Proceedings of the 32th ACM International Conference on Multimedia, ACMMM 2024 Conference

[Arxiv] [Code] [Page] [Demo] [Cite]

Self-supervised Video Summarization Guided by Semantic Inverse Optimal Transport

Yutong Wang, Hongteng Xu, Dixin Luo†(† corresponding author)

Proceedings of the 31st ACM International Conference on Multimedia, ACMMM 2023 Conference

[Paper] [Code] [Cite]

Self-supervised Video Summarization Guided by Semantic Inverse Optimal Transport

Yutong Wang, Hongteng Xu, Dixin Luo†(† corresponding author)

Proceedings of the 31st ACM International Conference on Multimedia, ACMMM 2023 Conference

[Paper] [Code] [Cite]

Weakly-Supervised Temporal Action Alignment Driven by Unbalanced Spectral Fused Gromov-Wasserstein Distance

Dixin Luo, Yutong Wang, Angxiao Yue, Hongteng Xu†(† corresponding author)

Proceedings of the 30st ACM International Conference on Multimedia, ACMMM 2022 Conference

[Paper] [Code] [Cite]

Weakly-Supervised Temporal Action Alignment Driven by Unbalanced Spectral Fused Gromov-Wasserstein Distance

Dixin Luo, Yutong Wang, Angxiao Yue, Hongteng Xu†(† corresponding author)

Proceedings of the 30st ACM International Conference on Multimedia, ACMMM 2022 Conference

[Paper] [Code] [Cite]

Education

Experience

Selected Publications (view all )

Weakly-Supervised Movie Trailer Generation Driven by Multi-Modal Semantic Consistency

Weakly-Supervised Movie Trailer Generation Driven by Multi-Modal Semantic Consistency

Efficient Video Face Enhancement with Enhanced Spatial-Temporal Consistency

Efficient Video Face Enhancement with Enhanced Spatial-Temporal Consistency

An Inverse Partial Optimal Transport Framework for Music-guided Movie Trailer Generation

An Inverse Partial Optimal Transport Framework for Music-guided Movie Trailer Generation

Self-supervised Video Summarization Guided by Semantic Inverse Optimal Transport

Self-supervised Video Summarization Guided by Semantic Inverse Optimal Transport

Weakly-Supervised Temporal Action Alignment Driven by Unbalanced Spectral Fused Gromov-Wasserstein Distance

Weakly-Supervised Temporal Action Alignment Driven by Unbalanced Spectral Fused Gromov-Wasserstein Distance

All publications