论文阅读-03
这篇是对《Training data-efficient image transformers & distillation through attention》这篇论文的阅读和理解笔记,其中不乏疏忽或误解之处,发现者还请指正。
摘要
DeiT 是一个全 Transformer 的架构。其核心是提出了针对 ViT 的教师-学生蒸馏训练策略,并提出了 token-based distillation 方法,使得 Transformer 在视觉领域训练得又快又好。
介绍
经典模型 ViT 的缺点和局限性
使用Transformer结构完成视觉任务的典型的例子比如说 ViT 。Transformer的输入是一个序列 (Sequence),那么现在我们有的是一堆图片,如何转成序列呢?ViT所采用的思路是把图像分块 (patches),然后把每一块视为一个向量 (vector),所有的向量并在一起就成为了一个序列 (Sequence),ViT使用的数据集包括了一个巨大的包含了300 million images的JFT-300,这个数据集是私有的,即外部研究者无法复现实验。而且在ViT的 ...
论文阅读-02
这篇是对《Feature Pyramid Networks for Object Detection》这篇论文的阅读和理解笔记,其中不乏疏忽或误解之处,发现者还请指正。
FPN能够很好地处理小目标的主要原因是:
FPN可以利用经过top-down模型后的那些上下文信息(高层语义信息)
CNN网络由浅到深,分辨率越来越粗糙,特征图越来越小,因为池化产生的不同尺寸的特征图。但是越高层,语义信息越丰富。相似的思想利用在FCN的自顶向下连接(这边可以跳层连接哦)。也就是要识别多尺度的目标,利用不同尺度的特征图。对于小目标而言,FPN增加了特征映射的分辨率(即在更大的feature map上面进行操作,这样可以获得更多关于小目标的有用信息)
总结来说,FPN = top-down的融合(skip layer) + 在金字塔各层进行prediction。
摘要
目标的多尺度一直是目标检测算法极为棘手的问题。像Fast R-CNN,YOLO这些只是利用深层网络进行检测的算法,是很难把小目标物体检测好的。因为小目标物体本身的像素就比较少,随着降采样的累积,它的特征更容易被丢失。为了解决多尺度检测的 ...
论文阅读-01
这篇是对《Simple Baselines for Human Pose Estimation and Tracking》这篇论文的阅读和理解笔记,其中不乏疏忽或误解之处,发现者还请指正。
摘要
在个人的理解中,这篇论文所做主要工作是为姿态估计(pose estimation)和姿态追踪(pose tracking)这2个研究领域各构建了一个架构简单,性能较高的基线模型。
PS:姿态估计和姿态追踪是什么:姿态估计是尝试从图像中推断出物体或人的姿势。这涉及识别和定位身体上的关键点,因此关键点检测是其中重要的一环。姿态追踪则是更进一步,在确定了姿态的基础上,于视频中实时跟踪人体姿态。
介绍
进行这项工作的原因:
随着姿态估计技术的迅速成熟,近年来提出了更具挑战性的“simultaneous pose detection and tracking in the wild”课题。
与此同时,网络体系结构和实验实践也日益复杂。这使得算法的分析和比较更加困难。
关于位姿跟踪,虽然目前还没有太多的研究,但随着问题维数和解空间的增加,系统的复杂度有望进一步提高。
这项工作是如何解决如上的问题 ...
Transfer to CS
呜2年过去了,还是想稍微记录一下这2年的一些和计科的一些"恩怨情仇"。
楔子
一切得追溯到高考结束的那段时候了,当时查分一看,得,滑铁卢了,再定睛一看,语文不及格,当时心态属于是完全炸了。
但再崩溃,人也要过下去,因此我开始给自己找后路,开始翻阅各个学校的分数情况,专业情况以及专项,转专业等等等等的难度,最后的打算是尝试南大,保底武大,上科大备选。最后上天还是眷顾我的,我中了南大,来到了地学大类。
起
来到地学大类之后的去向,无非是:大气,地科,地海以及环境,刚入大学的我,抱着我那常年倒一的地理成绩一看,觉得这不行,我得另谋生路,便开始翻阅转专业的准入要求,思来向后辗转反侧,权衡完利弊,最后决定,转计科!
决定完之后便开始了选课,回忆当时真的就是一门一门对着看,看课程大纲,看培养方案,看准入要求,最后再和自己的地学的课表去比对,尝试把时间全部错开来。
功夫不负有心人,最后我完美的把2个专业的课表融合在了一起,虽然代价是得到了一张4天早八几乎满课的课表,但总的而言还是值得的。(这边想要插一句,我是第一学期过去了一大半才知道有转专业群的存在,消息确实有点闭塞了,但自己去找需要的资料和信息, ...
sperf
这是对 22-23 年秋季学期南京大学操作系统课程的 Lab 的实验记录,这边为蒋炎岩老师班的课程。
本博客是对 OS Lab M3 的编程实验的个人的思考过程与部分解答。
课程主页: http://jyywiki.cn/OS/2023/
pstree实验主页: https://jyywiki.cn/OS/2023/labs/M3.html
注意:这不是非官方答案,不完全正确,仅适当参考。
注意:请勿直接复制粘贴,否则后果自负。
每一个人都有属于自己的一片森林, 也许我们从来不曾去过, 但它一直在那里,总会在那里。 迷失的人迷失了,相逢的人会再相逢。 即使是你最心爱的人, 心中都会有一片你没有办法到达的森林。
——《挪威的森林》
整体思路
sperf的任务和pstree类似,都是通过查阅手册熟悉操作系统的接口,实现出一个小工具。实现思路jyy也已经告诉我们了,我们只需要照着复刻即可:
解析出 COMMAND 和 ARG,这可以当做是普通的编程练习;
使用fork创建一个新的进程:
子进程使用 execve 调用strace COMMAND ARG.. ...
plcs
这是对 22-23 年秋季学期南京大学操作系统课程的 Lab 的实验记录,这边为蒋炎岩老师班的课程。
本博客是对 OS Lab M2 的编程实验的个人的思考过程与部分解答。
课程主页: http://jyywiki.cn/OS/2023/
pstree实验主页: https://jyywiki.cn/OS/2023/labs/M2.html
注意:这不是非官方答案,不完全正确,仅适当参考。
注意:请勿直接复制粘贴,否则后果自负。
我装作老成,人人就传言我老成。我假装是个懒汉,人人就谣传我是懒惰虫。我假装不会写小说,人们就说我不会写。我伪装成骗子,人们就说我是个骗子。我充阔,人人以为我是阔佬。我故作冷淡,人人就说我是个无情的家伙。然而,当我真的痛苦万分,不由得呻吟时,人人却在认为我无病呻吟。
——《斜阳》
整体思路
M2 的任务是对 LCS 算法进行并行化,从而在数据较大的时候可以较大幅度的加快 LCS 的运行速度,降低运行时间。
可以发现同一条正斜对角线上的点的计算上相互无依赖的,而相邻的斜对角线之间一定存在依赖,因此同一斜对角上的点可以同时计算,但不同斜对角线上的点必须有一定 ...
pstree
这是对 22-23 年秋季学期南京大学操作系统课程的 Lab 的实验记录,这边为蒋炎岩老师班的课程。
本博客是对 OS Lab M1 的编程实验的个人的思考过程与部分解答。
课程主页: http://jyywiki.cn/OS/2023/
pstree实验主页: https://jyywiki.cn/OS/2023/labs/M1.html
注意:这不是非官方答案,不完全正确,仅适当参考。
注意:请勿直接复制粘贴,否则后果自负。
在这个光怪陆离的人间,没有谁可以将日子过得行云流水。但我始终相信,走过平湖烟雨,岁月山河,那些历尽劫数、尝遍百味的人,会更加生动而干净。 时间永远是旁观者,所有的过程和结果,都需要我们自己承担。
——《因为懂得,所以慈悲——张爱玲的倾城往事》
整体思路
实现的整体思路在实验主页已经较为详细的描述,这边再复述一遍:
得到命令行的参数,根据要求设置标志变量的数值;
得到系统中所有进程的编号 (每个进程都会有唯一的编号) 保存到列表里;
对列表里的每个编号,得到它的的父进程是谁;
在内存中把树建好,按命令行参数要求排序;
把树打印到终端上。
因此我们 ...