一、团队概况
智能神经网络技术团队由陈金广教授带队,核心成员包括张晓滨、李维乾、马丽丽、苏雪平副教授,贺姗工程师及许靖婷博士等。团队长期深耕人工智能领域,聚焦“目标检测与跟踪”、“基于图像生成的虚拟试穿系统”、“三维人体建模与测量及服装合体性研究”以及“个性化推荐算法”四大特色研究方向。团队已在国际SCI期刊发表论文30余篇,主持国家级、省部级科研项目多项。
团队高度重视科研条件建设,为研究生配备了V100/3090/4090系列GPU工作站、无人机及工业相机等视觉检测装置,为科研探索、学科竞赛及产学研合作提供坚实保障。
二、特色研究方向
1、多视角三维人体重建及测量
针对传统三维人体测量设备成本高、体积大的瓶颈,团队研发了面向通用消费级图像的低成本、高精度三维人体数字化重构与自动测量系统。提出分段采集的多视角重建策略,结合人体分割掩码优化机制,提升了点云模型的完整性与纯净度。进一步融合ICON与SMPL-X人体模型进行非刚性拟合与姿态对齐,实现了身高、胸围等关键尺寸的端到端自动提取,为纺织服装行业的“智改数转”提供了低成本AI视觉检测底座。
*相关成果:申请国家发明专利1项*

图1 虚拟试衣网络模型结构图
[1]陈金广,张心洁,马丽丽,张凯兵,樊威.基于多视角图像的三维人体点云重建与自动测量方法.申请号:202511908085.8,申请日:2025年12月17日
2、基于轻量化扩散模型的虚拟试衣方法(DAT-VITON)
针对高保真、低算力虚拟试衣的紧迫需求,团队提出轻量化扩散模型框架DAT-VITON。通过层次化动态窗口自注意力机制重构U-Net骨干,将计算复杂度降至线性级别;结合姿态导引的服装变形模块与图像融合模块,解决了高精细度面料纹理与人体自然过渡的问题,消除了拼接伪影。该方法在图像逼真度与计算效率上达到国际领先,为边缘端制造与零售部署提供了高效AI算力底座。
*相关成果:发表于ISCAIT 2026、Multimedia Systems等,申请国家发明专利1项*

图2 虚拟试衣网络模型结构图
[1].Jinguang Chen, Dongchuang Zhao, Lili Ma. End-to-End Virtual Try-On via Latent Diffusion Model with Multi-Condition ControlNet[C]. ISCAIT 2026
[2].Dongchuang Zhao, Lili Ma*, Jinguang Chen, Kaibing Zhang, Wei Fan. DAF-VITON: Lightweight Diffusion Virtual Try-On via Efficient Dynamic Attention and Boundary-Aware Fusion. Multimedia Systems 32, 328 (2026).SCI,https://doi.org/10.1007/s00530-026-02397-5
[3]马丽丽,赵东闯,陈金广,张凯兵,樊威.针对高分辨率服装人体图像的轻量化扩散虚拟试衣算法.申请号:202511827701.7,申请日:2025年12月05日
3、基于服装区域对齐和风格保持调制的真实性虚拟试穿方法(SPM-VITON)
针对虚拟试穿中未对齐区域导致伪影的问题,团队提出SPM-VITON网络。该方法完善了未对齐区域定义,采用两阶段策略:首先由条件生成器预测目标分割图并变形服装,引入区域相似性作为学习目标;其次通过上下文风格保持的试穿生成模块进行融合。在VITON-HD数据集上的实验表明,该方法在定性和定量上均优于现有高分辨率试衣方法。
*相关成果:发表于《The Visual Computer》,申请国家发明专利1项*

图3 虚拟试衣网络模型结构图
该成果发表在国际期刊《The Visual Computer》,并申请国家发明专利。
[1]Jinguang Chen, Xin Zhang, Lili Ma*, Bo Yang, Kaibing Zhang. CS-VITON: A Realistic Virtual Try-on Network based on Clothing Region Alignment and SPM. The Visual Computer, 41(1): 563-577 (2025). SCI, IF=3.5 WOS:001194634300002
[2]陈金广,张馨,马丽丽.基于服装区域对齐和风格保持调制的真实性虚拟试穿方法.申请号:2023109019799,申请日:2023年07月21日
3.手臂区域保留的虚拟试穿网络(SP-VITON)
为解决人体区域特征保持和服装自然贴合的挑战,团队提出手臂区域保留的试穿网络SP-VITON。几何匹配模块计算服装变形参数;手臂区域保留模块构建修正的人体表示,合理保留原人体手臂区域;最后结合视觉Transformer进行融合。该方法在较低参数量下,获得了更具真实感的试穿结果。
*相关成果:发表于《Applied Soft Computing》,申请国家发明专利1项*

图4 AP-VITON结构图
该方法发表在国际Top期刊《Applied Soft Computing》上,申请国家发明专利,信息如下:
[1]陈金广,张馨,马丽丽.采用手臂区域保留策略的虚拟试穿方法.申请号:2023113336522,申请日:2023年10月16日
[2]Xin Zhang, Jinguang Chen*, Lili Ma, Kaibing Zhang. A Virtual Try-On Network with Arm Region Preservation. Applied Soft Computing, 2025,volume 175, 112960. SCI, IF=7.2 WOS:001458720700001
5、基于多分布拟合的多视角立体匹配重建方法(MDF-Net)
为实现低内存、高效率的高分辨率深度图推理,团队提出多视角重建网络MDF-Net。采用四阶段级联结构:提出VCR代价体聚合削弱匹配噪声;使用多分布拟合(MDF)自适应细化深度搜索区间(高斯分布粗调,拉普拉斯分布精调),仅需80个深度平面;最后利用轻量级超分网络提升分辨率。在DTU数据集上取得最先进重建效果,推理1600×1184深度图仅需约4.29G内存。
*相关成果:发表于《Machine Vision and Applications》*

图5 MDF-Net网络结构
该成果已于2023年发表在图像处理国际期刊Machine Vision and Applications上。
[1]Multi-distribution fitting for multi-view stereo. Machine Vision and Applications 34,93 (2023). https://doi.org/10.1007/s00138-023-01449-4 (SCI, IF:3.2)
6、自适应空间不确定性感知的多视图三维重建网络(AP-UCSNet)
针对自适应深度细化间隔和轻量级功能挑战,团队提出AP-UCSNet。利用卷积操作计算同物理表面的相邻点,加权平均获得空间相关的深度假设样本,有效减轻弱纹理区噪声影响。网络扩展为四尺度结构,前三尺度用3D UNet正则化,最后一尺度直接构造概率体积。相比UCSNet,误差显著减小,预测1600×1184深度图仅需0.57秒和4398M内存,效率大幅提升。
*相关成果:发表于《Applied Intelligence》*

图6 AP-UCSNet网络结构
该成果已于2023年发表在图像处理国际期刊Applied Intelligence上。
[1]Uncertainty awareness with adaptive propagation for multi-view stereo. Applied Intelligence 2023, 53(21): 26230-26239. https://doi.org/10.1007/s10489-023-04910-z (SCI, IF:5.3)