数学

3月13日(周三)

杜玮

基于数学和统计方法对于ChIP-exo数据可重复性进行评估

此次汇报我将主要介绍
1、ChIP-exo数据的特性
2、当前对此类数据可重复性进行测量的主要方法:“irreproducible discovery rate” (IDR)
3、此类方法存在的弊端及改进方向

刘迪一

Gamblet方法在图像与数据分割中的应用

近年来,计算机视觉和多尺度快速数值方法成为了研究者关注比较多的领域。毕业设计Gamblet方法在图像与数据分割中的应用包含两个方向,其中一个是使用多尺度快速算法求解在图像分割中的特征根问题,另一个是通过Optimal Recovery的方法得到合适的non-parametric kernel并使用这个kernel在高斯回归中,如此来进行图像分割或者数据分类。由于第二个方向内容简洁便于理解,第一次汇报主要集中在第二个方面。我将介绍Normalized Graph Cut Algorithm 和 Kernel Flow Algorithm 并介绍如何通过这些算法实现图像或数据分割。

张正鑫

Stationary solution of the radially symmetric compressible Navier-Stokes system

We consider the radially symmetric solution to the compressible Navier-Stokes system. The first problem is to characterize the stationary solutions. We first consider the inviscid case, and then we solve the vanishing viscosity problem.

钱程阳

A simple multibody system on a discrete circle

We give an understanding on how to extend Robinson matrix to high dimention, and generalize previous work on relations between generalized Robinson matrix and generalized Kalmanson matrix.

3月20日(周三)

濮怡萍

强化神经网络: 设置ISOMAP层提高卷积神经网络的鲁棒性

介绍卷积神经网络和ISOMAP降维算法的背景知识。

俞冲

一类方程的可控性

打算做读书笔记,简单介绍一下我的思路,第一次先介绍关于控制论的一些基本概念,然后证明线性系统可控的一些引理。

赵越

哈密顿方法的分析与应用研究

介绍问题来源以及基本的MCMC方法以及HMC方法;再对其中遇到的问题进行研究;细致平衡条件讲解;再对四个问题进行数值模拟与比较;最后介绍一些相关的优化方法。

黄冠杰

Minimal Representations of p-adic Exceptional Groups: Background and Construction

约化代数群的极小表示是特征展开与极小幂零轨道相对应的表示。在这次报告中,我们简单回忆p进例外群上的极小表示的背景知识,介绍Kazhdan-Savin构造的对于p进E型约化代数群的极小表示的构造与验证,并且利用Gan-Savin的局部Fourier-Jacobi Model给出极小性的另一种证明。同时,简单介绍p进群的lattice model以及毕业设计的下一步工作:构造极小表示的lattice model。

刘宸恺

Singular solutions of linear problems with fractional Laplacian

We aim to study singular solutions of linear problems with fractional Laplacian. The Bôcher type theorem is a crucial part. Our distributional approach only requires the basic $L^1$ integrability. Several basic lemmas are introduced to unify the treatments of Laplacian and fractional Laplacian.

3月27日(周三)

张轶飞

VC dimension in Neural Nets

1,VC维的简介,以及研究神经网络VC维的数学意义。
2,已有的相关的历史研究结果。
3,接下来研究的一些idea。

蒋修远

配对交易的部分理论

配对交易,最初是八十年代中期华尔街著名投行Morgan Stanley的量化交易员Nunzio Tartaglia成立的一个量化分析团队所提出的一种市场中性投资策略。 我们将重点考虑统计套利。
基于统计套利的配对交易策略,具体的说,就是指从市场上找出历史股价走势相近的两只股票进行配对,当配对的两只股票的价格差偏离历史均值时,则同时做空其中一只股票以及做多另一只股票,等待他们回归到历史均值再进行平仓,从中获取利润。
我将重点汇报自己工作的理论部分,包括协整法以及随机价差法,涉及到一些光滑算法和卡尔曼滤波器。

余涛

双曲空间高精度计算

n维双曲空间是具有极大对称性,单连通的n维黎曼流形,可以类比为具有负曲率的n维球。在双曲空间的度量下,距离计算相当敏感,微小扰动将导致距离计算和导数上的较大偏差。为解决这个问题,本项目利用双曲空间的性质,考虑其上等距变换群的一个子群,及其作用于双曲空间上包含原点的基本域,利用其等距性质,双曲空间中任何两点的距离都可以通过该子群的元素和基本域上的点来进行计算,避免距离计算对于噪声等偏差的敏感性,更进一步的,我们可以更加精确的存储这些数据,精确计算距离和相应导数,避免数值计算敏感性。

4月3日(周三)

张驰麟

A Survey of Several Aspects of Shrinkers

In my work, I’d like to focus on Simon Brendle’s work on the rigidity of shrinker which is topologically a sphere. I’d introduce several methods used in study of shrinkers, like Simons identity, mean value property, small energy estimate, etc. My goal is to write a survey of Brendle’s work.

陈昊哲

ADMM 算法在逆协方差矩阵估计中的应用

在高维数据分析中,逆协方差矩阵的估计是其中一个相当重要的部分。本次汇报介绍了三种不同的估计方法并指出这三种估计方法都可以用ADMM算法实现。

崔健

有限单群分类定理的若干思考

有限单群分类定理,是20世纪完成的最伟大的定理之一,它吸引了大批数学家投入其中,并在有限群论领域取得了巨大的发展和进步。其中的交错群,特殊射影线性群和马蒂厄群是最早发现的有限单群,在代数乃至整个数学中都具有重要的应用和地位。本次汇报主要介绍了该定理的来源及历史,并简要介绍了交错群和特殊射影线性群的单性及相关理论。

岳宸阳

二阶椭圆形微分方程的Lp理论

介绍sobolev空间和二阶椭圆形微分方程的Lp理论,为w2p估计做理论基础。

4月10日(周三)

刘菁蔚

Algorithmic Composition

Algorithmic composition of classical music

侯家齐

L-functions for GLn

I will present the definition of L-functions for cuspidal automorphic representations of GL_n over number fields and I will start with defining adeles.

彭一凡

有限元方法中基函数的优化

此次报告主要阐述了有限元方法中基函数的优化问题的背景和我们计算中得到的一些数值结果和分析

王恩泽

深度多重网格在一维和二维上一个简单方程的表现

我们使用深度多重网格方法针对一维和二维上一个简单方程上, 考察优化后的多重网格方法和有限元方法的表现.

万立哲

双曲平衡律系统解的局部存在性探究

本次汇报主要考虑双曲守恒律系统解的局部存在性问题。通过构造近似解并考虑近似解能量的估计,可以得出弱解的局部存在性和解的能量的一些估计。

4月17日(周三)

杜玮

基于数学和统计方法对于ChIP-exo数据可重复性进行评估

本次汇报的主要内容为介绍我们根据ChIP-exo数据的特性提出的基于欧氏距离的适用于测量其可重复性的方法,并将其与IDR进行比较,展示数据实验结果。

刘迪一

Gamblet方法在图像分割中的应用

进一步介绍Gamblet算法与博弈论思想在图像分割中的应用

张正鑫

Stability problem of the radially symmetric compressible Navier-Stokes system

简要总结了近几十年关于compressible Navier-Stokes 方程的稳定性问题的相关结果。

钱程阳

Kalmanson diversity

We make definitions on “interlacing”, “cyclic k-partition” etc., and introduce our present results with these new definitions.

4月24日(周三)

赵越

哈密顿蒙特卡罗方法的分析和应用研究

介绍毕设应用算法,对比他们的优点和缺点。
针对特定问题,比较各方法数值结果,并进行分析

黄冠杰

Sheaves on the building

A building is a CW complex on which G has a natural action on. By Schneider-Stuhler we can attach a sheaf to a smooth representation of G. We intend to illustrate the relation between structure of sheaves and representations.

刘宸恺

分数阶Laplacian的极大值原理和Dirichlet问题

基于上次给出的分数阶Laplacian的B\^{o}cher型定理,我们推出了分数阶Laplacian带有孤立奇点的解的极大值原理。此外在我们的推导过程中,我们还得到了分数阶Laplacian的一般形式的极大值原理和Dirichlet问题存在唯一性。

张驰麟

A Survey of a Few Aspects of Shrinkers

This time, I’ll talk in details about compactness argument given by Choi-Schoen. They have shown that small L^1 loc bound for the A^2 implies its C^0 loc bound, and hence the C^1 loc bound of the Gauss map. The compactness argument relies on elliptic behavior of A^2 and the mean value property.

5月8日(周三)

濮怡萍

降维层的嵌入对于卷积神经网络鲁棒性的影响研究

首先,全面介绍了对抗性攻击方法的三个方向,以及针对它的防御的几种发展方向。
其次,说明了嵌入降维层的防御性,然后详细介绍了三种经典的降维方法,以及如何将它们与卷积神经网络模型结合。
最后,选取了两类经典的白盒和黑盒攻击的算法,实验分析嵌入降维层的防御性,同时分析权衡了精确度的损失。

蒋修远

配对交易中交易策略在中国市场的实证研究

详细介绍了配对交易策略中的随机价差模型法,运用EM算法的思想,通过两个步骤对参数进行优化,分别是卡尔曼滤波和光滑办法。在得到参数的前提下,运用随机微分的知识解出回归时刻的最大似然估计,从而完成交易。

余涛

双曲空间高精度计算

在完成相应定理和误差的证明后,本次汇报主要测试本方法在现实数据集上的表现结果,具体而言有两方面的实验,首先是利用该基于群结构的方法对已有的嵌入模型进行压缩,在保持准确率的情况下,降低嵌入的存储大小。其次,利用该方法进行传统机器学习,学习不同数据集上的嵌入,并进行对比。

5月15日(周三)

俞冲

一类方程的可控性

对线性系统采用 Hilbert Uniqueness 方法,并将一些一般性的线性系统作为例子来论证。比如输运方程和 KDV 方程。然后对于这些这些方程为我打算对其可控性进行一些整理,寻找其共性的地方以及整理思路和方法。对于极小本性可控其没有充分必要条件的特点,寻找其充分或者等价的条件,从而对非线性系统有更好的研究。

陈昊哲

ADMM 算法在逆协方差矩阵估计中的应用

在第一次阶段性汇报的基础上,讨论了ADMM算法在不同逆协方差矩阵估计方法中的实现和不同条件下算法运行的结果。

崔健

有限单群分类定理的若干思考

本次汇报首先定义了置换群中的两个重要概念:多重传递群和本原群,简单介绍了对其现有的研究结果。接着给出了正规子群和单群概念的一个推广,即特征子群和特征单群,并介绍了相应的结构定理。最后构造了两个较小的马蒂厄群,说明它们的多重传递性,并概述了它们的单性的证明。

岳宸阳

二阶椭圆型偏微分方程的Lp估计

介绍了W2p内估计和全局估计,在狄利克雷问题的解唯一前提下证明了存在性。

5月22日(周三)

刘菁蔚

Algorithmic Composition of Classical Music

Many algorithmic composition methods are either developed by imitating the styles and structures of existing corpus, or only able to produce raw materials for composers or other systems to make use of.

侯家齐

Godement-Jacquet L-Functions

I will present the definition of Godement-Jacquet L-functions and their analytic properties. In the nanarchimedean case, we will see Langlands quotients and their local factors. In the archimedean case, I will talk about the relation to local Langlands correspondence and Artin L-functions.

彭一凡

基于变分方法对有限元方法基函数的改进

我们在之前计算结果的基础上进行了更加准确的分析,并对多组实验的结果进行了对比,得到了更为详细的结果。我们此次报告就在前一次报告的基础上进行了更加完善的结果展示,并加以准确的分析。

王恩泽

针对多重网格优化有限元方法的误差分析

本次主要汇报之前给出的简单方程和今天给出的复杂方程的泊松方程的多重网格优化有限元方法的误差分析.

万立哲

双曲平衡律方程的适定性研究

In this talk, we will mainly focus on the global existence, uniqueness and the local structure of the hyperbolic system of balance laws.

物理学

3月19日(周二)

张欢

dimer method的数值实现方法

本次汇报回顾了dimer method的理论基础,并介绍了dimer method在自由能计算中的应用的具体算法流程,重点介绍了投影法的应用,即 constrained dynamics 通过引入拉格朗日乘子的数值实现。本次介绍的方法通过编写内嵌在分子动力学模拟程序包Gromacs 2018中的源代码对benchmark system,即丙氨酸二肽进行模拟。

赵杰

不同激光功率下激光前向转印机制分析

本次汇报着重于对于激光前向转印工艺最佳转印能量区间的探究,通过共聚焦显微镜对于上下转印镜片的观察并结合有限元分析来分析出不同激光脉冲能量下金属膜的转印机制,为以后大规模转印提供参数支持

高正东

基于光偏振耦合效应的量子力学模拟

本次汇报将首先介绍课题主要原理。包括周期性极化铌酸锂的耦合模理,量子力学中的几何相变,拓扑相变等理论。并利用耦合模理论与二能级系统的可类比性将光学现象与量子现象结合起来,实现光实验平台的量子力学过程模拟。

于伯梁

光子散射过程的计算

本次汇报介绍毕业论文研究工作截止目前的进展——如何在量子电动力学(QED)框架下正确地得到双光子散射的低能近似结果。要点包括:
1.不同拓扑结构的费曼图(不同通道)及其对称性
2.正确的维数正规化步骤及对数发散的抵消
3.低能极限下的近似展开
4.螺旋性结构

3月26日(周二)

龚靖渝

机器学习在天文图像上的应用

自动进行强引力透镜信号探测和星系形态分类是大型巡天项目的需求,而机器学习为此提供了契机。此外Galaxy Zoo所提供的数据以及模拟的信号数据为训练提供了样本。本课题主要将各方的数据整合,将机器学习的方法应用于强引力透镜与星系形态分类中,通过给出星系属于不同形态的概率以及不同分类标准下的准确率和召回率供不同用途使用。本次汇报主要包括背景介绍,数据的收集与预处理,本课题所应用到的神经网络结构,星系形态分类的结果以及错误的分析以及未来工作的计划。

安相炎

激光驱动尾场加速中的电子自旋演化

在激光驱动尾场加速中,Sokolov-Ternov效应可以忽略,电子自旋主要依T-BMT方程进动,根据编写程序的模拟结果,可以分析此过程中的电子自旋变化,并试图找到使被加速的电子保持极化的方案。

张兆涵

氦离子的超快电离与磁量子数之间的关系

我们采用数值求解含时薛定谔方程,强场近似理论等方法对二维氦离子m=1的束缚态的电离进行了数值研究,对形成非对称动量谱的原因进行了探讨。

陆星宇

活性转子系统的性质

活性转子系统中,驱动能量由转动自由度输入,能通过转动-平动的耦合激发丰富多彩的行为。我们在前人的方案基础上提出了一种新的活性转子设计方案,可以使我们实时操纵每一个转子的行为,从而能进行更为丰富的实验。

4月2日(周二)

朱逸凡

CEPC HCal Cooling System Simulation

The report provides a result for RPC PCB heat simulation. With different simulation tools and conditions we have confirmed the effectiveness of our results. And a multi-layer model is tested for future cooling design.

金哲霆

在Ca3Ru2O7中两个不同的金属铁电相之间的相变

在过去的几十年中,48K一级相变以下的Ca3Ru2O7低温相仍然是一个难题,包括金属铁电、轨道或磁有序等猜测仍存在争议。
通过对实验晶格结构的分析、密度泛函理论计算和有效模型分析,我们提出了48K相变是磁介导轨道再极化促进的成键转变。
最有趣的是,这种转变伴随着两个金属铁电序从xy+y对称转变为xz+z。
我们的研究不仅解决了这一材料中相变的一个长期难题,而且也可能演示了由于多铁性有序之间的相互作用而导致的多种金属中的多个涌现的铁电有序之间的转变的第一个例子。

杨宇宁

B样条基函数含时薛定谔方程的编写和应用

  1. 编写三维氢原子的B样条基的含时薛定谔方程,并使用英特尔商业MKL函数库进行效率优化。
  2. 一些目前利用该函数进行的模拟研究计算结果。

4月9日(周二)

胡晨曦

数值模拟研究超快激光作用下 H2分子离子的电离与解离过程

我们通过数值模拟求解含时薛定谔方程的方法,研究了氢分子离子在超快激光的作用下,发生解离与电离的过程。在超快激光的作用下,氢分子离子会发生解离。正在解离的氢分子离子与另外一束飞秒激光相互作用,会出现电子在两核之间振荡的现象。对于正在发生振荡的电子波函数,通过另外一束阿秒激光作为探测光,可以使其电离,然后通过光电子动量谱来分析发生电离时电子在两核之间的分布情况,进而实时观察电子振荡的过程。

魏麒恒

激光悬浮微粒超快动力学四维研究装置

通过模拟确定了整个装置的光路

梁昆

PandaX暗物质实验利用机器学习进行位置重建

在液氙探测器中,我们采用二相型的时间投影室作为容器,并以液氙作为靶物质进行暗物质探测。首先,粒子会与液氙原子进行碰撞,碰撞过程中,会释放能量沉积在时间投影室中。这部分能量一方面会发出光子,另一方面会电离液体产生激活电子。发射出的光子会直接进入光电管中被探测到,被电离的电子会在外加电场的拖拽下打入气氙,并激发出更多光子,最终被光电管探测到。

本课题的内容就是利用S2信号在光电管阵列上的分布重建信号位置。S2信号被光电管探测到后,会在顶部光电管阵列上产生一个信号强度分布。不同位置处的S2信号在光电管上产生的信号分布也不同,利用两者一一对应的关系,我们可以重建出信号位置。

4月30日(周二)

张欢

Finite Temperature Dimer method 数值结果与分析

本次汇报回顾了dimer method的理论基础和算法流程,并介绍代码在Gromacs中实现的具体流程和方法,以及对数值结果的展示和理论分析。

赵杰

激光前向转印制造方法在制备疏水超材料中的应用

我们设计了实验对于转印液滴的速度进行了测量,并且对于结果作出分析

高正东

基于光偏振耦合的量子力学模拟

这一阶段的工作是对光在PPLN晶体中的非拉比共振的探测。也就是探测在存在位相失配的情况下的光偏振演化情况,对应量子力学中的情形就是存在失谐(detuning)的拉比振荡。首先要探测并绘制波长-位相失配曲线,有3个方法,理论手段利用Sellmeier方程计算,但是利用单纯的折射率方程计算误差较大。第二第三种方法是利用特殊光偏振的演化来找到对应的波长,通过特定初态的光,在一定条件下(电压,温度,位相失配,入射波长)可转变成为水平偏振光,借此找到对应位相失配。
得到位相失配-波长曲线后,再做相应数学变化,得到非拉比共振曲线。由于激光器输出光的信噪比较低,最终得到的曲线只在第一个周期内和理论匹配的较好

于伯梁

磁单极与相应光子散射修正

本阶段工作主要集中于对于磁单极理论的钻研以及磁单极存在情况下光子散射过程的计算。主要汇报内容为如下几点:
1.电磁对偶理论与电磁相互作用的作用量(拉格朗日量)的修正,以及相应SL(2,Z)对称性,或S-对偶。
2.磁单极存在时产生的Witten效应。
3.利用双荷子(Dyon)作为费米子圈的光子散射振幅的计算,以及与Witten效应的比较。

5月7日(周二)

龚靖渝

机器学习在天文图像上的应用

在本次汇报中,我们将比较VGG、Inception以及我们设计的网络架构在星系形态分类上的效果。此外,我们还会给出绝对星等测试的正确率的影响以及使用irg三个波段的图像与r波段图像进行分类的差异。我们试图将模拟的强引力透镜信号图像与SDSS的图像结合,但发现两个数据集不能混用,于是我们利用了模拟的强引力透镜正负样本进行分类。我们对KiDS所公布的信号源进行筛选,并将星系形态分类的分类器应用于筛选过后的信号源图像上,我们发现椭圆星系所占比例与训练用的数据相差较大,于是我们比对了两者天体绝对星等的分布,同时检查了我们分类器给出的椭圆星系比例随绝对星等的变化关系,符合我们所知的规律。

安相炎

使用自旋极化电子束诊断尾场

在得到自旋极化电子束之后,我们提供了一个使用层状自旋极化电子束来诊断等离子体中尾场的应用方案,并提供了利用自旋分布反演得到所诊断的尾场情况的理论模型。在这一过程中我们利用高能电子束在等离子体中产生尾场,将层状极化电子束以垂直于或者反平行于尾场的方向入射,考察电子束在经过尾场之后的自旋分布情况以及在经过尾场过程中受到尾场中电磁场的影响。

张兆涵

氦离子的超快电离与磁量子数之间的关系

我们开发了一套经典轨迹蒙特卡罗法研究隧穿电离问题的数值工具,对绝热非偶极双色场作用下氢原子的隧穿电离中非偶极效应与激光构象之间的关系进行了探讨。

陆星宇

动态光场控制下的机器人运动

进行了动态光场控制机器人的实验和相对应的模拟,分单列波、多列波、手性多列波等多种情况。结果发现了单列波图像的两个峰、多列波与单列波与多列波的异同、手性多列波时发生的转动扩散现象。

5月14日(周二)

朱逸凡

CEPC HCal Cooling System Simulation

基于五层和大面积的单层RPC模型,给出使用水冷板的不同设计方案的模拟,讨论其冷却效果和可行性。研究二氧化碳的冷却效果。

金哲霆

高温超导体理论

介绍了通过一个tightly pairing模型(波色子模型)理解铜基超导体中的各种传统理论无法解释的现象,不仅仅包括各种统计性质,比如光导,电阻,相变温度,比热等等,更是涵盖了具体的实验,如ARPES和STM看到的谱图。

杨宇宁

强红外激光场中异核氢分子离子的高次谐波产生

通过数值模拟含时薛定谔方程(TDSE),研究了短周期红外强激光场中异核氢分子离子的高次谐波产生。通过反转几个周期激光脉冲的载波包络相位,电子动力学也被反转。然而,由于核质量不同,两个核以不同的排斥速度移动,这使得当载波包络相位移动π时,重新散射过程不相同。不同的重新散射过程导致截止区域中的不同谐波光谱。质量相关的谐波光谱提供了一个新的超高时间和空间分辨率的同位素动力学诊断。

胡晨曦

数值模拟研究超快激光作用下 H2分子离子的电离与解离过程

我们通过数值模拟求解含时薛定谔方程的方法,研究了氢分子离子在超快激光的作用下,发生解离与电离的过程。在超快激光的作用下,氢分子离子会发生解离。正在解离的氢分子离子与另外一束飞秒激光相互作用,会出现电子在两核之间振荡的现象。对于正在发生振荡的电子波函数,通过另外一束阿秒激光作为探测光,可以使其电离,然后通过光电子动量谱来分析发生电离时电子在两核之间的分布情况,进而实时观察电子振荡的过程。

魏麒恒

激光悬浮微粒超快动力学研究装置

双光束光镊,cdi相位恢复

梁昆

利用神经网络算法重建PandaX-4T探测器信号位置

在当前阶段的工作中,我们成功搭建了神经网络框架对已有数据进行训练。我们通过控制变量调整出合适的神经网络深度和广度,同时对数据集的规模和训练周期进行了估算。最终我们成功进行了位置重建,其精确度在1厘米左右,并且运算速度有了约两个数量级的提升。

计算机科学

3月25日(周一)

汤舒扬

基于DAG结构的共识模型研究

我们分析现有IOTA、Byteball两大基于DAG的分布式记账本的共识方案,深入剖析他们的安全性和效率。通过对于基于DAG的分布式记账本建立普适的研究模型,量化安全性的评估。针对他们可能存在的安全隐患,改进共识算法的构造,并通过量化模型推导出合理的参数设置,从而提出新型、安全、高效的基于DAG的新共识协议。

仇知

第一次阶段性检查

完成了与已有模型的效率比对,生成了新的数据,同时确定了新feature的生成方式。

盛佩瑶

基于深度对抗网络的童声识别

第一阶段我主要完成了论文调研、基线训练及基础生成模型的搭建工作。首先,我从童声识别,数据增强和生成对抗网络三个方面调研了论文并进行了总结整理。然后我用成人语音及少量儿童语音训练了基线模型,并用少量儿童语音训练了基础生成模型,测试了生成数据的效果。

郑怜悯

毕业设计第一次汇报

介绍调研结果,提出TensorIR的设计

刘思柒

DNN作为三维形状的表达方式的表达能力的初步结果

从DNN对于不同的三维形状的表达上,在某些指标上进行其表达能力的探索的初步结果。

卢思迪

基于合作式多智体交互的自监督学习——对优化JSD的一个实现

本文探讨了在训练生成式模型的时候,经典算法的局限性之所在,并且从数学属性出发,给出了一个可能的探索方向。基于这个方向,本次汇报特别讨论了这个方向下的一个特例,即对于Jensen-Shannon散度的优化过程的一个实践。

方智涌

对于利用机器学习辅助人工标注问题的探究

在这个人工智能飞速发展的时代,人工智能对于已标注数据的需求量呈现爆发式增长的趋势。各种各样的任务如图像分类,图像标注,关键点检测都依赖于大量人工标注的数据,因此众多外包数据标注公司也应运而生。人工标注员可以说是人工智能时代的“建筑工人”,而我的毕业设计课题用通俗易懂的话来说,就是给“建筑工人”减负,提高他们的工作效率。

黎金宁

基于生成式对抗网络的人脸超分辨率与识别

阶段汇报(一) 介绍已完成的工作:
调研复现 SRCNN SRGAN ESRGAN模型
实测依图人脸数据
接入人脸识别系统验证表现
下一步工作:
测试在更低输入分辨率下的超分辨率和人脸识别表现。
使用人脸识别提取的feature计算loss,辅助GAN的训练。
探究和改进模型输入是自然产生的低分辨率图片时的表现。

曹孟尧

用生成对抗网络提升图像文本描述的生成效果

通读了相关的参考文献,理解了本课题所需的模型的结构和具体实现细节,并在github上找到了模型中生成器部分的开源代码。

龙思杉

基于脚本的对话管理器初步设计

为了设计一个让开发者进行各种场景对话的开发平台,我们希望开发者可以通过在平台上填写表格、拖动对话结点等方式进行任务型对话的逻辑设计。我们将用户输入转化为脚本,再将脚本转化为可编译的代码,运行该代码后机器就可以与人进行特定场景下的对话。在阅读了相关论文和调研已有的对话平台后,我们已经初步完成了基于脚步的对话管理器的设计,抽象出了定制一个对话需要的元素以及需要标准化的空间,基本确定了用户定义逻辑的格式和脚本的格式。目前也完成了最简易版的前端界面,正在着手实现后端,也即将脚本转化为可编译可执行的代码这一部分。

孔冰玉

高效的分布式机器学习训练框架初探 阶段性汇报

在这段时间内选定基础的GPU沟通框架为horovod,并针对horovd将已有的训练系统进行了匹配性的调整,使其具有分布式的结构。下一步为梯度压缩以及弹性系统的部署

方博慧

课题大纲

目前国际上最新的研究成果中, 有前人提出了可以用强化学习的方法从平台角度优化机制设计,从而最大化收益;但是此前尚没有课题考虑到平台不能高频操作的限制,亦或是对参与的智能体的学习方法的学习,本课题提出的学习智能体梯度的方法从更深层次的角度考虑了机制设计中普通个体的学习过程。
本课题计划在机制学习问题中寻找一种深度元学习算法,在真实场景中,如广告商分配或竞价拍卖,既能符合平台机制拥有合理性的基本需求,又能实现学习到智能体的学习过程,以深度获取机制设计中的社会性总福利或总收益。

秋闻达

面向程序设计教育的学习行为数据挖掘算法

首先我将再次介绍课题的背景,意义以及内容。按照计划,目前为止我的主要任务是查找学习相关论文;整理数据,思考、设计算法。我将介绍我之前已经了解到的现有模型的细节,并给出我思考的改进方向。我将收集一个现实中的真实数据集,我会给出过程遇到的一些问题和对应的计划。此外,我完成了一个交互平台前后端的基本功能,将展示界面截图。

冼臧越洋

基于多重网格的实时柔性体仿真技术

该汇报将讲述实时柔性体仿真技术的应用,以及当前毕设的进展

胥拿云

第一次阶段性汇报

介绍问题背景与设定,大致算法框架与数据集选择,以及确定工作计划

徐植天

移动众包的任务分配与个性化推荐-第一次阶段汇报

目前主要进行了任务的题目内容特征的提取以及聚类,后面主要想进行任务标注时间的预测。

许臻佳

大规模视频的快速检索和过滤算法

具体确定了项目需要解决的问题,决定兼顾单张图片和连续视频;根据问题找了相关数据集,有的是公开数据集,也有公司内部的数据集;完成了特征抽取部分,比较了两个模型,其中小模型虽然准确率有小幅度下降,但是速度提高了10倍;正在做的部分是特征聚类。之后还要做物体检测以及将几个模块拼接在一起一起调优。

叶昊然

自底向上的姿态估计模型的分析与优化

针对人体姿态估计估计模型中的自底向上算法中的部分亲和字段(PAF)模型,介绍其原理。并从生成关键点的热点图到对关键点进行组合等步骤中,分析并提出了其实验以及理论上的优缺点。并且针对每一种缺点,提出了解决的方案。并阐述了自己已经进行的实验,以及实验结果:通过加入对于关键点的先验知识,提高了某些精准度,但未能提高平均精准度(MAP,模型的度量标准)。

吴怡然

小数据学习的现状分析与初步实验结果汇报

  1. 简要介绍了目前小数据学习的主流思路:度量学习、元学习与引入约束,涉及了典型方法如Siamese Network, Matching Network, MAML等。
  2. 阐述了本次毕业设计的大体思路:通过基于元学习的数据扩增引入约束。
  3. 汇报了一些初步的实验结果,以及相关结论、下一步的方向。

陈欣昊

基于Transformer的深度文本匹配算法

我们尝试复现当下的大量深度文本匹配算法, 并在中英上进行了尝试, 发现BERT的性能远优于这类非预训练的深度文本匹配算法, 决定了接下来的工作会基于BERT

苏雨峰

第一次阶段性汇报

在本阶段中,我与导师商量并确定了具体课题,设计了三种可以用于解决问题的算法,并且初步确定英文语料集以及数据集生成方法

谭博文

基于图神经网络的对话管理

确定了在图神经网络中具体的据结构设计: 每个slot视为图中的一个点(一个sub-agent),每一步在图上进 行指定的计算,不同的点对在计算过程中可以通过边进行信息交互.

杨嘉成

基于预训练的深度机器翻译

机器翻译是指一种能够自动将某个文档从一种语言转化到另外一种语言的算法。随着深度神经网络的发展,人们发现通过训练更深的神经网络可以得到更好的效果,但是训练更深的神经网络却存在这诸多困难(如梯度消失、梯度爆炸等问题)。在我们的课题中,我们发现平行语料相对较少难以获得、而单语料较为丰富容易获得,因此我们将通过语言模型(Language Model)来对网络中编码器部分(Encoder)来进行预训练。在这一阶段中,我们完成了翻译训练流程框架搭建、对于基线方法的评测、以及对于方法有效性评估。我们发现,通过单纯使用 BERT 模型会带来一些效果提升,但不明显;而通过直接加深网络的方法不能带来效果的提升。

杨卓林

基于生成对抗网络的抗噪语音识别

这次汇报主要涵盖了3月我的研究成果:1. 跑完了所有的基线结果并且做了比对。2. 尝试了一些新的方法(WGAN-GP,内积投影的鉴别器等等),对于好的结果进行了分析,对于不理想的结果进行了反思和改进。3. 提出了一个很有意思的引理并且由此得到了一个量化标准的合理性。

4月15日(周一)

汤舒扬

基于DAG结构的共识模型研究

基于DAG技术的共识方案拥有更佳的吞吐量、交易确认速度,并被认为拥有鲁棒的安全性。然而,由于缺乏实践与理论的验证,现有的基于DAG技术的共识方案的安全性、效率还有待深入研究。本课题中,我们研究已有的两大基于DAG技术的共识方案的安全性、效率。之后,我们设计出新型的高效、安全的共识机制。

仇知

中期检查

完成了交叉验证,确定了新的模型结构

盛佩瑶

基于深度对抗网络的童声识别

生成语音在识别模型上的效果验证,不同数据量的影响探究

郑怜悯

第二次阶段性汇报

介绍AutoScheduler的设计,汇报实验结果

刘思柒

DNN在3D重构方面的初步结果

探索了能够表达三位形状的最佳DNN结构,对一些shapenet上面的图片和形状进行了三维重建。

卢思迪

基于合作式多智体交互的自监督学习

接续上次阶段性汇报的相关分析,对于整个合作式交互的框架进行了细致的设计和进一步分析。同时给出了关于这中间梯度估计过程的一个大胆猜想,留作下一阶段的工作重点。

方智涌

对于利用机器学习辅助人工标注问题的探究中期汇报

在Cifar100 这个数据集上,目前我们使用了与传统的主动学习不同的基于不确定性的采样方式,减少了约10%的标注量,此外,我们显示地考虑了批次样本间的异质性,又减少了大约5%的总标注量。目前我们的方法在分类问题上是比较有效的。
首先,我们在分类问题上的效果还不足够明显,我们希望能进一步提升方法,给标注代价带来更大地提升。 其次,我们的方法并不能很自然地范化到其他数据集以及其他问题上,我们希望能够在更加广泛的任务上,进行测试,来验证方法的有效性。或者是发现该方法在哪些问题上无效并分析原因。

黎金宁

基于生成式对抗网络的人脸超分辨率与识别 第二次汇报

在调研和复线了最新的超分辨率算法后,我们发现现有的超分辨率算法在人脸上表现都不好,扭曲和变形严重,不但不能改进人脸识别准确率,反而使准确率下降。
我们提出了一个id preserving loss来改进这个问题,实验已经初步证明了我们方法的可行性,后续仍需考虑各种改进方法。

曹孟尧

用生成对抗网络提升图像文本描述的生成效果

跑通了生成器部分的开源代码,能够初步的实现图像文本描述生成。完成了判别器部分的两种模型的编写,尚在调试阶段,预计很快能开始进行生成器和判别器的对抗式训练。

龙思杉

基于脚本的对话管理器初步设计

为了设计一个让开发者进行各种场景对话的开发平台,我们希望开发者可以通过在平台上填写表格、拖动对话结点等方式进行任务型对话的逻辑设计。我们将用户输入转化为脚本,再将脚本转化为可编译的代码,运行该代码后机器就可以与人进行特定场景下的对话。在阅读了相关论文和调研已有的对话平台后,我们已经初步完成了基于脚步的对话管理器的设计,抽象出了定制一个对话需要的元素以及需要标准化的空间,基本确定了用户定义逻辑的格式和脚本的格式。目前也完成了最简易版的前端界面,正在着手实现后端,也即将脚本转化为可编译可执行的代码这一部分。

孔冰玉

分布式机器学习训练系统框架的搭建

完成了对具体动态训练功能的分布式机器学习训练系统基本框架的搭建。

方博慧

中期汇报

在当前大数据的风潮中,我们旨在提出一种算法框架使得Multi-Agent Actor-Critic for MIxed Cooperative-Competitive Environments论文提出的MADDPG(Multi-Agent DDPG)框架能正确处理DDPG(Deep Deterministic Policy Gradient)作为普通参与个体的广告博弈情况。目前算法平台上高级算法和基础算法已经全部跑通,在实现过程中代码并未遇到过多阻碍,手写的总第三方仲裁系统也运转良好,但运算速度不算很快,实验速率或许有提升空间。总体看一切正常。

秋闻达

面向程序设计教育的学习行为数据挖掘算法 第二次阶段汇报

本次汇报将包含一个经过精炼的课题背景介绍和任务目标介绍。本次汇报的主体内容是现阶段的完成情况,主要包括了数据集的收集与整理,现有方法的调研情况和一些初步的实验结果。本次汇报还将包括下一个阶段的任务计划。

冼臧越洋

基于多重网格的实时柔性体仿真技术

本次汇报中展示了我们的方法:如何基于Skinning空间构造的多重网格,它存在的问题以及解决方案。

胥拿云

第二次阶段性汇报

实验阶段性成果,代码完成情况汇报,结果初步观察,遇到的一些问题以及设计的解决方案

徐植天

移动众包的任务分配与个性化推荐-第二次阶段汇报

目前完成了任务规则的建模,算是对于任务的特征分析已经基本完成。下面将对用户的行为特征进行分析,统计用户的活跃时间,计算用户的活跃度。

许臻佳

第二次检查

在这个阶段,首先继续优化了特征抽取模块,在特征质量不下降的前提下提高了速度,并且特征为度又有了大幅度下降。另外,分析了局部敏感哈希的理论结果并用实验加以验证。接下来要加上物体检测模块,把整个系统进行端到端训练。最后尝试多种参数达到最佳性能。

叶昊然

人体姿态估计模型的优化

对于上一阶段中着重研究的部分亲和字段模型中提出的问题提出了改进的方案,对于后端Parsing的部分提出了新的改进方法并在实验上得到验证。对于前端关键点的热图的监测模型的改进实验进行规划。

吴怡然

小数据学习-实验结果汇报

  1. 回顾了问题定义与方法的基本框架
  2. 回顾了第一次汇报中尝试的两种数据扩增模块
  3. 展示了最近实验的两种新的数据扩增模块,其中CGAN generator with bottleneck有比较好的表现
  4. 列出了下一步的计划

陈欣昊

Transformer在深度文本中的应用

项目已经上线, 简单汇报下项目情况

苏雨峰

第二次阶段性汇报

完成数据集生成,以及完成所有三种算法的代码部分。

谭博文

基于图神经网络的对话管理

完成了图神经网络的大部分实验并取得了大大领先于传统深度强化学习模型的结果。

杨嘉成

基于预训练的深度机器翻译

在这一阶段中,我们发现通过知识蒸馏这种技术能够更好地去利用预训练语言模型中的知识,在我们的实验中,我们发现:1)BERT抽取出来的 Feature 比直接用 Word Embedding 更好;2)由于保留的信息更多,大模型比小模型效果更好;3)Encoder监督信号也能起到正面效果,但比直接用Feature要差;4)Decoder监督信号会比较严重地影响精度。在下一阶段中,我们将完成:1)完善知识提取在其他数据集上的验证实验工作(英法、英中数据集);2)尝试其他无监督训练模型生成的Feature,如GPT-2等;3)完成论文的初步编写

杨卓林

基于生成对抗网络的抗噪语音识别

这一段时间主要完成了基本计算模型的搭建,并尝试了用新的条件引入方法来设计条件对抗生成网络模型,取得了不错的效果

5月13日(周一)

汤舒扬

Bracing A DAG-Based Consensus with an Underlying Backbone Chain

Existing DAG-based consensus protocols are still far from satisfactory. We propose a novel two-layer framework of consensus, with DAG structure built on top of a backbone PoW blockchain.

仇知

自然语言到SQL

模型实现结果与问题分析

盛佩瑶

基于深度对抗网络的童声识别

验证各生成数据训练声学模型的解码效果,包括不同模型、数据量、标签生成方式对解码效果的影响;引入了状态条件信息

郑怜悯

第三次阶段性汇报

报告TensorIR的设计情况,重点在依赖分析

刘思柒

DNN表达下的三维形状在3D重构方面的一些结果

讲述了在将DNN作为表达方式下,三维重构的可视化方法,可视化基结果和与其他重构方法的对比。

卢思迪

基于合作式多智体交互的自监督学习

接上回叙述。我们得到了一个理想的用于合作式交互的目标函数,然而这个目标函数还没有完全摆脱不可导的梦魇。我们使用了一个大胆的处理方式——丢掉其中不可导的部分。这样做有道理吗?在多大的程度上是有效的?本次汇报将尝试围绕这个问题进行一定的论证。此外,这篇文章的投稿-接收经历一波三折,也颇有着墨一二的价值。

方智涌

对于利用机器学习辅助 人工标注问题的探究

前两次阶段性汇报:
1. 在Cifar100 数据集上测试了不同的采样方式对于总标注代价的影响。
2. 提出了一个基于不确定性以及批次区分度的采样方式,有少量提升。
本次汇报:
1. 将方法扩展至另一个分类数据集上,得到相似结论。
2. 在图像分割数据集上进行测试,得到不一样的结果。

黎金宁

基于生成式对抗网络的人脸超分辨率与识别阶段汇报三

  1. 改进了ID Preserving Loss, 同时考虑正例和负例
  2. 设计了将IP-FSRGAN应用于人脸识别的框架
  3. 在公开数据集上验证了IP-FSRGAN的表现
  4. 在依图公司人脸识别系统和数据上验证IP-FSRGAN
  5. 攥写了英文版论文并投稿BMVC2019

曹孟尧

基于生成对抗网络提升图像文本描述的生成效果

完成了生成器(CNN-RNN模型)和判别器的预训练并以生成对抗网络的方式进一步训练。选择不同λ(判别器和客观度量标准的配比)的不同的Q(客观度量标准)的训练结果的对比会在PPT中的表格中呈现。

龙思杉

基于脚本的对话管理器初步设计

为了设计一个让开发者进行各种场景对话的开发平台,我们希望开发者可以通过在平台上填写表格、拖动对话结点等方式进行任务型对话的逻辑设计。我们将用户输入转化为脚本,再将脚本转化为可编译的代码,运行该代码后机器就可以与人进行特定场景下的对话。现在我们已经完成了基于脚步的对话管理器的设计, 确定了用户定义逻辑的格式和脚本的格式。后端现在也基本完成,并对前端界面进行了美化。正在进行论文撰写。

孔冰玉

动态的分布式训练系统构建进展

完成了调度器的设计和实现,在公司内部开始进行上线测试。

方博慧

面向机制设计的强化学习和元学习算法——第三次检查

前述模型已全部跑通,之后的计划是砍掉不必要的附加实验,进入论文写作阶段。

张哲恺

图排序的硬件加速器设计

加速器实现时对架构的更多改进内容;同一硬件架构(流式多路归并)的更多应用:加速大型稀疏矩阵乘法

秋闻达

面向程序设计教育的学习行为数据挖掘算法

除了惯例进行的课题概要,问题描述等部分,本次汇报将主要完善实验部分结果的展示,针对上次汇报中遇到或提出的问题(结果的指标,标签的使用等)进行了补充。

冼臧越洋

基于多重网格的实时柔性体仿真技术

本次汇报中展示了我们的方法在实验中的数值表现,以及一个小demo来展示实际效果。

胥拿云

社交网络中的信息传播与预测-毕业设计第三次阶段性汇报

解决第二次阶段性汇报中遇到的两个问题。以及由于服务器问题,实验结果没有能及时更新

徐植天

移动众包的任务分配与个性化推荐-第三次阶段汇报

主要提出基于用户的角度进行推荐的算法,将问题脸谱化(忽略任务本身的特征)。

许臻佳

大规模视频的快速检索和过滤算法

和其他研究员讨论了“物体检测”模块的实现方式,最后决定这个模块从系统中剥离,有另一个团队完成,我们的项目的输入就直接是物体检测之后的边界框。另外综合测试了整个系统的时间,发现 numpy 会对矩阵乘法有大幅度优化,这样即使我们的算法在理论上有5倍的提升,但实际效果还不如 numpy。对于这个问题目前还在尝试解决

吴怡然

半监督小数据学习-第三次阶段汇报

1.回顾问题情境
2.展示对模型结果的一些解释
3.汇报论文写作情况

陈欣昊

基于Tranformer的深度文本匹配算法

文本匹配算法在今日头条推荐系统中的去重应用

苏雨峰

第三次阶段性检查

完成所有代码部分,之后需要等待实验室服务器修复之后重新整理数据,将会优先撰写论文。

谭博文

基于图神经网络的对话管理

任务介绍:对话系统与对话策略
图神经网络:简单介绍构造与设计,提供数学表示
实验结果:包含单任务以及领域迁移结果

杨嘉成

基于预训练的深度机器翻译

本次汇报主要汇报这一阶段所做的主要实验与实验结果。本次汇报的实验将从更加完善的几个方面完善之前的想法,并将阐述接下来的时间内应该完成的工作。

杨卓林

基于生成对抗网络的抗噪语音识别

这段时间主要整理了所有实验,完成了网络深度对于结果的影响图,并将数据归一化进行公平的比较。同时开始了论文的写作。

化学

https://zhiyuan.sjtu.edu.cn/articles/3600