当前位置：首页 > news >正文

贵港市网站建设_网站建设公司_API接口_seo优化

news 2025/12/18 13:48:47

临沂网站设计制作,阿里云万网网站,自己制作宣传图片,门户网站建设工具前情提要什么自监督学习#xff1f; 做不需要标注资料的任务#xff0c;比如做填空题#xff0c;比如预测下一个任务#xff01; 这个时候我们只需要对在自监督中训练的模型进行fine-tune就可以用在下游任务中了#xff01; 但是在不需要标注的数据之前呢#xff0c;在…前情提要什么自监督学习做不需要标注资料的任务比如做填空题比如预测下一个任务这个时候我们只需要对在自监督中训练的模型进行fine-tune就可以用在下游任务中了但是在不需要标注的数据之前呢在BERT、self-supervised learning之前有一个工具叫做Auto-Encoder 也是不需要标注的数据的。 Auto-Encoder 怎么运作的它是一个无监督的不需要任何标注资料的任务目的就是让图片经过中间的网络后和最终的目标尽可能的相似和Cycle GAN中的方法是一样的中间的Vector叫做Embedding、Representationcode都是指的是同一件事这有什么用呢我们要使用的中间的这个Vector它不再是原来图片的高维向量比如100 * 100维度的图片如果是RGB那么就是3万维度而经过Encoder 压缩之后的低维向量这个向量往往是10维100维等。同时Encoder的输出也叫做瓶颈层叫做BottleNeck因为我们输入的是宽维度的向量但是最终输出的是低纬度向量同时这也叫做Dimension reduction。也可以叫做pre-train Dimension reduction方法有PCA、t-SNE它们不是深度学习 Why Auto-encoder 为什么Auto-encoder能获取存储图片信息的低维度的向量呢这些向量怎么就能代表这个图片呢因为图片的变化看起来大但是却很小。图片的变化类型是有限的我们只需要记录这几种变化类型就可以就仿佛上图中四个3*3大小的图片只有两种类型所以我们只需要记录这两种变化类型就行了 01和10就够了就仿佛神雕侠侣中樊一翁它的胡子虽然变化多但是只是表象头的可变化的类型很少我们只需要预判了它的头的变化就可以了。 Auto-encoder 并不是一个新的idea 原来的方法并没有深度学习的概念要分块进行训练的 De-noising Auto-encoder 给原图片添加噪音然后还是让它恢复到原来的图片那么这个encoder必须有能力来去除噪音这在BERT中也有相同的应用比如添加mask 所以我们可以说BERT就是一个添加了噪音的Auto-encoder 当然Decoder不一定是一个Linear层也可以自己定义哦 Feature Distangle Distangle 就是把原来纠缠在一起的东西解开来下面的各种特征都在这里面但是我们并不知道哪些特征代表了哪些资讯所以我们是不是可以分解出特征来比如前五十维度表示内容信息后五十维度表示的是说话人的信息等等当然feature Distangle也是有很多的办法来去做的这是有办法做的下边的就是方法了每一个dimension就代表了一个资讯 Application Voice Conversion Voice Conversion语音转换就是柯南的领结变声器在过去都是有监督学习在采集样本时候需要Speaker A 和 Speaker B录制相同的语音这样才能完成模型的训练但是现在我们可能不再需要一模一样的录制了比如下面的encoder中的特征一部分代表了语者一部分代表了语音。那么我们就可以交换语音让某个人说别人的话 Discrete Representation 向量的表示有三种可能性 Real Numbers、Binary和One-hot 比如Binary中某一个值就代表了是不是的问题是男的还是女的戴眼镜了吗而One-hot也代表了分类任务比如0-9手写体的识别例子VQVAEVector Quantized Variational Auto-encoder Codebook中是一系列向量是学习出来的数据同时也是预定义的向量我们需要的就是计算Encoder出的向量和Codebook中的相似度相似度最高的那个向量就作为Decoder的输入类似于Self-attention 当然也可以用在语音识别中在语音识别中codebook中的向量完全可以代表kk音标 Text as Representation 我们可不可以embedding出文字而不是向量呢该文字经过Decoder后会得到整个文章而该sequence就是文章的核心和摘要这是一个seq2seq2seq的auto-encoder 而这个任务仅仅需要一大堆的文件拉进行训练这个模型。但是这是不行的因为Decoder会发明自己的暗号中间生成的文字是看不懂的文字这要怎么办呢这个时候就可以添加一个DiscriminatorDiscriminator是可以分出输出是不是真汉字的所以Discriminator可以判断中间的单词是不是问题。这样就可以添加双向限制既能生成文章又可以判断出是不是汉字这就是CycleGAN 我们就硬Train Tree as Embedding Application Generator 我们可以将Decoder作为Generator 我们通过模型训练之后得到Decoder Compression 如果图片太大了我们可以把Encoder当作压缩器来生成低维向量而Decoder做的事情Decompression但是这样得出的图片是有失真的 AnomalyOutlier、Novelty Detection 检查输入的x和训练数据是不是一样! 但是我们的x正确不正确完全取决于训练数据欺诈检测训练数据正确的信用卡交易网络的侵入检测黑客检测连入是不是正常的细胞检测是不是一个癌细胞和分类任务的区别分类任务是需要大量正反样本的而且其中很多错误的样本就混在了正样本里。但是现实中是很难收集很多的负样本的再比如人脸识别这肯定不能收集所有的负样本啊只能是收集正样本这是一个one-class问题而不是二分类问题这就需要Auto-encoder登场了人脸检测我们检测是不是真人的人脸而不是二次元的那么我们就可以通过搜集一堆的人脸图片通过将它们encoder和Decoder如果能合成真人图片那么就是真人如果输入的是二次元图片那么在经过encoder和decoder后是合成不了正常的图片的 More about Anomaly Detection

查看全文

http://www.lebaoying.cn/news/2615.html