Liang Luo

Publications

*: equal contribution

Journal Publications

[TMLR'26] Hybrid Architectures for Language Models: Systematic Analysis and Design Insights. Sangmin Bae, Bilge Acun, Chien-Yu Lin, Haroun Habeeb, Seungyeon Kim, Liang Luo, Junjie Wang, Carole-Jean Wu
[TMLR'25 J2C Award] Mixture-of-Transformers: A Sparse and Scalable Architecture for Multi-Modal Foundation Models. Weixin Liang, Lili Yu*, Liang Luo*, Srinivasan Iyer, Ning Dong, Chunting Zhou, Gargi Ghosh, Mike Lewis, Wen-tau Yih, Luke Zettlemoyer, Xi Victoria Lin.
Powering Meta Segment Anything 3, ByteDance Mogao and Bagel, Xiaomi-Robotics-0, Tencent HY-Embodied-0.5, Alibaba WAN Weaver and Nvidia Cosmos 3
[IEEE TPDS 2023] P4SGD. Hongjing Huang, Yingtao Li, Jie Sun, Xueying Zhu, Jie Zhang, Liang Luo, Jialin Li, Zeke Wang.
[IEEE Micro 2017] IncBricks: Enables in-network computation with a programmable network middlebox. Ming Liu, Liang Luo, Jacob Nelson, Arvind Krishnamurthy, Luis Ceze.
Selected as MICRO Top Picks 2018 Honorable Mention

Conference Publications

[ISCA'26] LoKA: Low-precision Kernel Applications for Recommendation Models At Scale. Liang Luo, Yinbin Ma, Quanyu Zhu, Vasiliy Kuznetsov, Yuxin Chen, Jian Jiao, Jiecao Yu, Buyun Zhang, Tongyi Tang, Xiaohan Wei, Yanli Zhao, Zeliang Chen, Yuchen Hao, Venkatesh Ranganathan, Sandeep Parab, Yantao Yao, Maxim Naumov, Chunzhi Yang, Shen Li, Ellie Wen, Wenlin Chen, Santanu Kolay, Chunqiang Tang
[ICML'26] Implicit Turn-Wise Policy Optimization for Proactive User-LLM Interaction. Haoyu Peter Wang, Yuxin Chen, Liang Luo, Buyun Zhang, Ellie Dingqiao Wen, Pan Li.
[ACL'26 Findings] ReasonRec: A Reasoning-Augmented Multimodal Agent for Unified Recommendation. Yihua Zhang, Mingfu Liang, Jiyan Yang, Rong Jin, Wen-Yen Chen, Yiping Han, Huayu Li, Buyun Zhang, Liang Luo, Luke Simon, Sijia Liu, Tianlong Chen, Xi Liu.
[SIGIR'26] SOLARIS: Speculative Offloading of Latent-bAsed Representation for Inference Scaling. Zikun Liu, Liang Luo, Qianru Li, Zhengyu Zhang, Wei Ling, Jingyi Shen, Zeliang Chen, Yaning Huang, Jingxian Huang, Abdallah Aboelela, Chonglin Sun, Feifan Gu, Fenggang Wu, Hang Qu, Huayu Li, Jill Pan, Kaidi Pei, Laming Chen, Longhao Jin, Qin Huang, Tongyi Tang, Varna Puvvada, Wenlin Chen, Xiaohan Wei, Xu Cao, Yantao Yao, Yuan Jin, Yunchen Pu, Yuxin Chen, Zijian Shen, Zhengkai Zhang, Dong Liang, Ellie Wen.
Powering Meta's Ads Recommendation.
[MLSys'26] FreeScale: Distributed Training for Sequence Recommendation Models with Minimal Scaling Cost. Chenhao Feng, Haoli Zhang, Shakhzod Ali-Zade, Yanli Zhao, Liang Luo, Jennifer Cao, Lisen Deng, Siqiao Chen, Chenyu Zhao, Tristan Rice, Daniel Johnson, Min Si, Tiantu Xu, Yi Zhang, Evgenii Kolpakov, Siqi Yan, Chunhao Zhuge, Min Ni, Bi Xue, Qunshu Zhang, Shen Li.
Powering Meta's Feeds Recommendation.
[KDD'26] Meta Lattice: Model Space Redesign for Cost-Effective Industry-Scale Ads Recommendations. Liang Luo, Yuxin Chen, Zhengyu Zhang, Mengyue Hang, Andrew Gu, Buyun Zhang, Boyang Liu, Chen Chen, Chengze Fan, Dong Liang, Fan Yang, Feifan Gu, Huayu Li, Jade Nie, Jiayi Xu, Jiyan Yang, Jongsoo Park, Laming Chen, Longhao Jin, Qianru Li, Qin Huang, Shali Jiang, Shiwen Shen, Shuaiwen Wang, Sihan Zeng, Siyang Yuan, Tongyi Tang, Weilin Zhang, Wenjun Wang, Xi Liu, Xiaohan Wei, Xiaozhen Xia, Yuchen Hao, Yunlong He, Yasmine Badr, Zeliang Chen, Maxim Naumov, Yantao Yao, Wenlin Chen, Santanu Kolay, GP Musumeci, Ellie Dingqiao Wen.
Powering Meta's Ads Recommendation.
[NSDI'26] Phantora: Maximizing Code Reuse in Simulation-based Machine Learning System Performance Estimation. Jianxing Qin, Jingrong Chen, Xinhao Kong, Yongji Wu, Tianjun Yuan, Liang Luo, Zhaodong Wang, Ying Zhang, Tingjun Chen, Alvin R. Lebeck, Danyang Zhuo.
[VLDB'25] DECK: Experiences on Delta Checkpointing for Industrial Recommendation Systems. Xin Gao, Sibu Acharya, Sihui Han, Yongxiong Ren, Yanli Zhao, Liang Luo, Chucheng Wang, Pradeep Fernando, Saurabh Mishra, Siqi Yan, Yicong Du, Ela Krepska, Intaik Park, Min Ni, Qunshu Zhang, Shen Li.
Powering Meta's Feeds Recommendation.
[ACL'25] The Efficiency vs. Accuracy Trade-off: Optimizing RAG-Enhanced LLM Recommender Systems Using Multi-Head Early Exit. Huixue Zhou, Hengrui Gu, Zaifu Zhan, Xi Liu, Kaixiong Zhou, Yongkang Xiao, Mingfu Liang, Srinivas Prasad Govindan, Piyush Chawla, Jiyan Yang, Xiangfei Meng, Huayu Li, Buyun Zhang, Liang Luo, Wen-Yen Chen, Yiping Han, Bo Long, Rui Zhang, Tianlong Chen.
[WWW'25] External large foundation model: How to efficiently serve trillions of parameters for online ads recommendation. Mingfu Liang, Xi Liu, Rong Jin, Boyang Liu, Qiuling Suo, Qinghai Zhou, Song Zhou, Laming Chen, Hua Zheng, Zhiyuan Li, Shali Jiang, Jiyan Yang, Xiaozhen Xia, Fan Yang, Yasmine Badr, Ellie Wen, Shuyu Xu, Hansey Chen, Zhengyu Zhang, Jade Nie, Chunzhi Yang, Zhichen Zeng, Weilin Zhang, Xingliang Huang, Qianru Li, Shiquan Wang, Evelyn Lyu, Wenjing Lu, Rui Zhang, Wenjun Wang, Jason Rudy, Mengyue Hang, Kai Wang, Yinbin Ma, Shuaiwen Wang, Sihan Zeng, Tongyi Tang, Xiaohan Wei, Longhao Jin, Jamey Zhang, Marcus Chen, Jiayi Zhang, Angie Huang, Chi Zhang, Zhengli Zhao, Jared Yang, Qiang Jin, Xian Chen, Amit Anand Amlesahwaram, Lexi Song, Liang Luo, Yuchen Hao, Nan Xiao, Yavuz Yetim, Luoshang Pan, Gaoxiang Liu, Yuxi Hu, Yuzhen Huang, Jackie Xu, Rich Zhu, Xin Zhang, Yiqun Liu, Hang Yin, Yuxin Chen, Buyun Zhang, Xiaoyi Liu, Xingyuan Wang, Wenguang Mao, Zhijing Li, Qin Huang, Chonglin Sun, Nancy Yu, Shuo Gu, Shupin Mao, Benjamin Au, Jingzheng Qin, Peggy Yao, Jae-Woo Choi, Bin Gao, Ernest Wang, Lei Zhang, Wen-Yen Chen, Ted Lee, Jay Zha, Yi Meng, Alex Gong, Edison Gao, Alireza Vahdatpour, Yiping Han, Yantao Yao, Toshinari Kureha, Shuo Chang, Musharaf Sultan, John Bocharov, Sagar Chordia, Xiaorui Gan, Peng Sun, Rocky Liu, Bo Long, Wenlin Chen, Santanu Kolay, Huayu Li.
[ICML 2024] Wukong: Towards a Scaling Law for Large-Scale Recommendation. Buyun Zhang*, Liang Luo*, Yuxin Chen*, Jade Nie, Xi Liu, Daifeng Guo, Yanli Zhao, Shen Li, Yuchen Hao, Yantao Yao, Guna Lakshminarayanan, Ellie Dingqiao Wen, Jongsoo Park, Maxim Naumov, Wenlin Chen.
Powering Meta's Ads Recommendation.
[MLSys 2024] Disaggregated Multi-Tower: A topology-aware modeling technique for efficient large-scale recommendation. Liang Luo, Buyun Zhang, Michael Tsang, Yinbin Ma, Ching-Hsiang Chu, Yuxin Chen, Shen Li, Yuchen Hao, Yanli Zhao, Guna Lakshminarayanan, Ellie Dingqiao Wen, Jongsoo Park, Dheevatsa Mudigere, Maxim Naumov.
[VLDB 2023] PyTorch FSDP. Yanli Zhao, Andrew Gu, Rohan Varma, Liang Luo, Chien-Chin Huang, Min Xu, Less Wright, Hamid Shojanazeri, Myle Ott, Sam Shleifer, Alban Desmaison, Can Balioglu, Bernard Nguyen, Geeta Chauhan, Yuchen Hao, Shen Li.
Runner-up Best Paper Award (Industry Track)
[MLSys 2023] NeuroShard: Learning to shard embedding tables with a pre-trained cost model. Daochen Zha, Louis Feng, Liang Luo, Bhargav Bhushanam, Zirui Liu, Yusuo Hu, Jade Nie, Yuzhen Huang, Yuandong Tian, Arun Kejariwal, Xia Hu.
[MLSys 2022] SRIFTY: A throughput and cost Optimizer for public cloud-based distributed training. Liang Luo, Peter West, Pratyush Patel, Arvind Krishnamurthy, Luis Ceze.
[ISCA 2022] NEO: Software-Hardware Co-design for Fast and Scalable Training of Deep Learning Recommendation Models. Dheevatsa Mudigere, Yuchen Hao, Jianyu Huang, Zhihao Jia, Andrew Tulloch, Srinivas Sridharan, Xing Liu, Mustafa Ozdal, Jade Nie, Jongsoo Park, Liang Luo, Jie (Amy) Yang, Leon Gao, Dmytro Ivchenko, Aarti Basant, Yuxi Hu, Jiyan Yang, Ehsan K. Ardestani, Xiaodong Wang, Rakesh Komuravelli, Ching-Hsiang Chu, Serhat Yilmaz, Huayu Li, Jiyuan Qian, Zhuobo Feng, Yinbin Ma, Junjie Yang, Ellie Wen, Hong Li, Lin Yang, Chonglin Sun, Whitney Zhao, Dimitry Melts, Krishna Dhulipala, KR Kishore, Tyler Graf, Assaf Eisenman, Kiran Kumar Matam, Adi Gangidi, Guoqiang Jerry Chen, Manoj Krishnan, Avinash Nayak, Krishnakumar Nair, Bharath Muthiah, Mahmoud Khorashadi, Pallab Bhattacharya, Petr Lapukhov, Maxim Naumov, Ajit Mathews, Lin Qiao, Mikhail Smelyanskiy, Bill Jia, Vijay Rao.
[NSDI 2022] NetHint: White-Box Networking for Multi-Tenant Data Centers. Jingrong Chen, Hong Zhang, Wei Zhang, Liang Luo, Jeffery Chase, Ion Stoica, Danyang Zhuo.
[IISWC 2021] Characterizing and Taming Resolution in Convolutional Neural Networks. Eddie Yan, Liang Luo, Luis Ceze.
[MLSys 2020] PLINK: Discovers and exploits datacenter network locality for efficient communication in cloud-based systems. Liang Luo, Peter West, Arvind Krishnamurthy, Luis Ceze, Jacob Nelson.
[USENIX ATC 2018] AUDIT: Troubleshoots transiently recurring errors in production systems with blame-proportional logging. Liang Luo, Lenin Ravindranath Sivalingam, Suman Nath, Madan Musuvathi, Luis Ceze.
[ACM SoCC 2018] Parameter Hub: Efficient software stack implementation for rack-level parameter servers. Liang Luo, Jacob Nelson, Luis Ceze, Amar Phanishayee, Arvind Krishnamurthy.
[MLSys 2018] Parameter Box: High performance parameter servers with balanced resource allocation. Liang Luo, Jacob Nelson, Luis Ceze, Amar Phanishayee, Arvind Krishnamurthy.
[ASPLOS 2017] IncBricks: Enables in-network computation with a programmable network middlebox. Ming Liu, Liang Luo, Jacob Nelson, Arvind Krishnamurthy, Luis Ceze.
[HPCA 2016] LASER: Uses PEBs events for sharing detection and online repair of false sharing with low overhead. Liang Luo, Akshitha Sriraman, Brooke Fugate, Shiliang Hu, Gilles Pokam, Chris Newburn, Joseph Devietti.

Workshop Publications

[KDD DLP 2022] DHEN: A Deep and Hierarchical Ensemble Network for Large-Scale Click-Through Rate Prediction. Buyun Zhang*, Liang Luo*, Xi Liu, Jay Li, Zeliang Chen, Weilin Zhang, Xiaohan Wei, Yuchen Hao, Michael Tsang, Wenjun Wang, Yang Liu, Huayu Li, Yasmine Badr, Jongsoo Park, Jiyan Yang, Dheevatsa Mudigere, Ellie Wen.
[ASPLOS WAX 2017] INA: Motivates in-network aggregation for accelerating data-intensive applications. Liang Luo, Ming Liu, Jacob Nelson, Amar Phanishayee, Arvind Krishnamurthy, Luis Ceze.

Preprints

MoMa: Efficient Early-Fusion Pre-training with Mixture of Modality-Aware Experts. Xi Victoria Lin, Akshat Shrivastava, Liang Luo, Srinivasan Iyer, Mike Lewis, Gargi Ghosh, Luke Zettlemoyer, Armen Aghajanyan.
Accelerating SpMM Kernel with Cache-First Edge Sampling for GNN Inference. Chien-Yu Lin, Liang Luo, Luis Ceze.
Cloud Collectives: Towards Cloud-aware Collectives for ML Workloads with Rank Reordering. Liang Luo, Jacob Nelson, Arvind Krishnamurthy, Luis Ceze.

Liang Luo

Education

Work Experience

Publications

Journal Publications

Conference Publications

Workshop Publications

Preprints

Community Service