3月24日(周二)

罗中瑭

代码算法自动分类的研究

课题进展总体较顺利。于收集数据方面,在APEX实验室的帮助下,获得了7千余例HDU和POJ上的源代码及其对应的标签,大大加快了课题的进展。于设计算法方面,基于目前现有的研究都依靠语法树、控制流图和数据流图进行分析的现状,初步设计了从源代码直接入手进行分类的软件。目前的F1分数约在70左右,正在试验各种修改以及优化。

汪陶磊

面向GPGPU图计算的统一内存寻址优化阶段汇报

CUDA中对于统一内存寻址的实现以及原本CUDA处理内存问题的对比。

郝琰

三维特征点提取的前期实验调查

本次汇报介绍了用于三维特征点提取的机器学习方法和传统几何方法的实验结果对比。

金之涵

二次分配问题中的组合构型第一次汇报

Monge矩阵和Kalmanson矩阵中最小哈密顿圈有通解。事实上,Monge矩阵可以被刻画为二阶差分非正。如果将这个定义推广到高维,如何定义哈密顿圈和Monge特性能够有比较好的性质?

刘予希

Predictions Analytic Pricing Based on Model Leakage (基于模型泄漏的预测分析定价) 第一次阶段性汇报

本次汇报主要内容为这段时间的进度展示:平台框架的论文叙述部分,通过系统图展示;交互流程的论文叙述部分,通过流程图展示;模型泄漏程度及定价问题的定义,通过公式展示;以及第一、第二种计算模型泄漏程度的方式,通过例子介绍。

谢杰

基于格的range proof的关键构件

1、同态性commitment
2、sigma-protocal的关键证明

严格

context aware recommendation system

对于相关工作的调研,初步想法。

谢雨桐

基于图切分的层次化全新分子设计

本次汇报将简单总结前期的工作,包括对层次化图理解与生成方法的整理,以及数据集的准备和基线模型的选择,同时还会介绍目前已经进一步完善的基于图切分的层次化全新分子设计方法,并尝试对其进行理论分析。

周子寒

毕业论文第一阶段汇报

  1. 主题回顾
  2. 算法整理
  3. 算法设计
  4. 今后计划

田博宇

基于图的微服务部署

本次汇报主要介绍了硬件图和软件图的建模,以及如何利用硬件图和软件图完成微服务部署。

张凯羿

基于加密算术电路的高效零知识证明 第一次阶段性汇报

基于加密算术电路的高效零知识证明 第一次阶段性汇报。

周久钦

SGX上的页错误攻击

随着SGX的流行,页错误攻击,作为针对SGX的经典攻击,在安全容器的环境下被复现。

应思豪

基于边缘计算的视频实时目标检测阶段汇报

目前已根据相关论文,基本复现了一个基于边缘计算的视频实时目标检测系统原型。本次汇报将会介绍该系统的实现思想和细节,及其在数据集上的表现。然后分析其缺陷,提出改进的思路和实现方法。

刘啸远

面向SQL 查询范式的自然语言理解 - 调研结果汇报与项目工作计划

为了在面向SQL 查询范式的自然语言理解这一课题的框架下进行数据的收集与实验方面的探索,二月至今我们确定了项目的合作团队,进行了详细的功能划分与工期预算。
本次汇报主要包含详细的项目计划,一些NL2SQL和对话系统的调研结果以及模型决策框架的初步设计。对于项目的功能和一些已有的各类工具产品进行对比,并描述本项目的实用性与创新性。

林虹灏

独立多项式复零点分布—第一次汇报

此次汇报为该课题的第一次阶段性汇报, 目前已基于bencs和csikvari的方法在负平面上得到了一个非零区域,但还需要更准备的计算。此外,接下来还要根据shearer’s bound结合其与lovasz local lemma的联系,并进行进一步的讨论。

李沐阳

基于端到端的非平行语料语音转换-第一次汇报

传统高质量的语音转换需要大量平行语料,这使得语音转换的成本非常高。同时,传统声音转换模型都是对于一些声学特征建模,这使得现有语音转换系统往往都需要一个声码器,来将声学特征转换为声音信号,这也使得这些系统往往都非常庞大笨重,同时在声码器在转换过程中也往往会引入一些杂音。传统端到端的方法,往往依赖于一个巨大的语音识别模型以及以及巨大的声码器Wavenet模型,模型庞大复杂难以训练,并且计算成本很高。本课题将基于目前高质量语音合成中广泛采用的端到端模型,研究采用大量非平行语料进行语音转换的方法,使用量化向量变微分编码器,直接对信号点建模,摆脱对于声码器的依赖,减少高质量语音转换的数据依赖,实现新型的语音转换模型。

王翰竟

基于深度学习的跨年龄人脸识别模型第一阶段复现工作汇报

复现了业界领先的基于深度学习的跨年龄人脸识别模型并在少量测试数据集上做了数值上的检验和对比。

张哲恺

图排序的硬件加速器设计

Gorder图排序算法的简单介绍,硬件加速Gorder的基本思路,模拟实验结果。

蒋泽天

多图的批量协同匹配与在线增量式匹配方法第一阶段工作汇报

多图的批量协同匹配与在线增量式匹配方法第一阶段工作汇报,主要包括研究内容回顾,先前方法复原情况,以及理论分析内容进展。

叶昊然

先验不准确时的单个买家的拍卖机制设计

介绍了先验不准确时的单个买家的拍卖机制设计的相关背景内容,给出先验分布不准确的刻画。介绍当前研究成果:相关的最优机制并给予直觉性的证明,并介绍后期的工作安排。

巫宇威

个性话聊天对话系统

第一阶段工作汇报,主要涉及论文工作总结以及复现工作结果。

刘天怡

实现高性能同态加密算法库

广泛调查了ckks加密方案的各种优化,包括对于实数加密时采用原有环结构的子环使得NTT效率提高约一倍,以及对比了几种模运算优化算法,并且基本完成了代码骨架的搭建。

朱立臻

基于对抗学习的多模态情绪识别时序样本生成阶段性汇报

EEG-GAN是脑电生成的代表模型之一,但其只能生成单轨道样本。本课题借用用于音频生成的museGAN思想拓展EEG-GAN到多轨道生成。EEG-GAN在保证时间一致性上借鉴了progressiveGAN,但attention is all you need阐述了加入attention可以学习到时间序列特征。因此,本课题将不使用EEG-GAN的借鉴PGAN的训练方法,而是加入attention机制。

段宇轩

深度学习在视频分析中的应用

在本次汇报中,我将介绍毕设课题选定的视频分析具体任务:时序动作检测(Temporal Action Proposal)的相关内容,包括任务背景、最近研究成果、数据情况以及切入点等。我还将汇报过去一阶段的工作内容和下一阶段的工作计划。

范舟

基于强化学习的推荐与广告合并算法设计

在信息流式的内容提供服务应用中,推荐系统与用户进行多步交互,每次向用户推荐一批次的内容,这其中可能既包括普通推荐内容,也包括广告内容。每次推荐系统提供的一批内容中广告的数量除了影响当前的用户反馈外,也会对用户的长期行为及推荐系统的长期优化目标产生影响。本次阶段性汇报主要介绍对推荐与广告合并的问题设定及基于强化学习的初步算法设计方案。

孙雪晖

有界树高SAT问题第一次阶段性汇报

将树高(tree-depth)的上界转化为路径宽度(path-width)的上界,通过图的路径分解长度上界来得出消解算法的运行时间上界,得到初步的研究结果。

王天哲

多图的协同匹配与聚类

多图的协同匹配与聚类,第一次汇报完成了前人方法的回顾和自己方法的设计。

吴章昊

基于序列建模的推荐系统用户价值预测之特征基线调研与序列模型梳理

课题初期,我制定了相关课题详细时间表。我主要对推荐系统用户价值预测任务中基础特征进行分析,尝试可能对模型训练有帮助的特征,例如,用户过去消费记录,以及转发点赞等特征,并分析了全年用户行为特性。除此之外,我还对多种不同的基线模型进行调研,包括了用户统计量,多任务回归模型,以及不同的模型损失函数,并分析了训练数据样本数量和所取时间段对模型的影响。其次,我对在推荐系统用户价值预测任务上,撰写了序列模型方案,罗列出可能的研究方向和困难。

徐子昊

高效的轻量化目标检测算法研究和实现-中期

本月主要是集中于各种先进算法复现和问题寻找。在这个月中,我确认了在目前的技术条件下,单步法是相对适合的。同时,我也寻找到了一个比较有意思的问题:在目标检测问题中,大物体的检测在传统的loss下会得到更多的重视。我希望能够通过修改loss,来实现不同尺度物体在训练中得到相同的重视。

冯思远

TVM调度及中间语言设计

简要介绍TVM调度算法和调度原语,并介绍全新的中间语言的初步设计,以及如何在全新设计上实现原有原语效果。

林耘丰

基于快速傅里叶变换的卷积神经网络常用算子实现

卷积神经网络的常用算子包括卷积,池化和激活函数等。其中卷积算子通常使用通用矩阵乘算法及其衍生算法实现。本研究基于快速傅里叶变换算法,将原本时域上的卷积变为频域上的乘法操作,从而以较低计算复杂度的方式实现卷积算子。对于其他算子,推导频域上的等价表达并实现。同时结合傅里叶变换的线性性和卷积定理的推论,将整个网络的算子在频域空间中进行计算,达到降低计算量,加速模型推理的目的。

范裕达

面向真实感知的机械臂仿真平台-第一阶段汇报

已经完成工作的综述:包括平台的整体架构,基础模块的实现,物理引擎的测试;之后的研究和工作方向;预期的结果和进度安排。

肖云轩

融入知识的自然语言理解第一阶段汇报

第一阶段工作主要集中在以下两方面:首先,调研整理了现有的融合知识图谱的自然语言理解方法,此类方法局限于将预训练的知识嵌入向量整合入语言模型中,且无法整合与输入文本相关的知识信息,存在诸多局限性;第二,完成了前期数据处理工作,将目标自然语言理解任务设定为关系抽取任务,收集并处理了一份篇章级关系抽取数据集以及两份句子级关系抽取数据集作为实验数据,同时下载并初步处理了开源Wikidata作为将使用的知识图谱。

李江贝

人体-物体交互行为理解

复现相关内容结果展示,思路明确及改进。

楼兰

基于深度学习的场景文本识别算法研究

  1. 研究RCTW17、MTWI18数据集
  2. 有针对性地制作合成数据集
  3. 实现CRNN模型、STR框架
  4. 在数据集上训练模型

刘畅

基于鲁棒强化学习的城市信号灯协同控制阶段汇报

截至目前,“阅读相关文献,并进行代码复现” 和 “完成模型设计构思”这两部分已经基本完成,并且利用WGAN完成了数据集的生成。当下主要的工作是在WGAN产生数据集的基础上,利用元强化学习算法进行模型训练。元强化学习的方法有很多种,在大量阅读参考文献之后,我暂定采用以MetaGenRL为基础的算法,原因是这种算法是目前面对环境变化的泛化能力最强的算法。所以,当前的主要工作就是:复现MetaGenRL,将其应用的信号灯控制上,并进行鲁棒性测试。

丁尧尧

基于区间的卷积神经网络架构搜索空间

本次汇报会介绍空间设计的背景及动机,然后简要介绍空间本身,探讨可能的搜索方法。