0%

1. Transformer是什么

Transformer是一个利用注意力机制来提高模型训练速度的模型。关于注意力机制可以参看这篇文章trasnformer可以说是完全基于自注意力机制的一个深度学习模型,因为它适用于并行化计算,和它本身模型的复杂程度导致它在精度和性能上都要高于之前流行的RNN循环神经网络。

对于RNN来说它一般只关注附近的关系关联,而没有从全局寻找关系紧密的相关特征。因此对于一些特定的场景,不能够很好的处理。而Transforme放眼全局,通过计算权重得到相应的向量,得到更为全面的特征

阅读全文 »

1、pytorch简介

pytorch是一个基于Python的科学计算包,PyTorch 的设计遵循tensor→variable(autograd)→nn.Module 三个由低到高的抽象层次,分别代表高维数组(张量)、自动求导(变量)和神经网络(层/模块),而且这三个抽象之间联系紧密,可以同时进行修改和操作。它主要有两个用途:

  • 类似于Numpy但是能利用GPU加速
  • 一个非常灵活和快速用于深度学习的研究平台
阅读全文 »

1.深度学习简述

为了学习一种好的表示,需要构建具有一定“深度”的模型,并通过学习算法来让模型自动学习出好的特征表示(从底层特征,到中层特征,再到高层特征),从而最终提升预测模型的准确率.所谓“深度”是指原始数据进行非线性特征转换的次数

深度学习是将原始的数据特征通过多步的特征转换得到一种特征表示,并进一步输入到预测函数得到最终结果.和“浅层学习”不同,深度学习需要解决的关键问题是贡献度分配问题(Credit Assignment Problem,CAP)[Minsky,1961],即一个系统中不同的组件(component)或其参数对最终系统输出结果的贡献或影响.从某种意义上讲,深度学习可以看作一种强化学习(Reinforcement Learning,RL),每个内部组件并不能直接得到监督信息,需要通过整个模型的最终监督信息(奖励)得到,并且有一定的延时性

阅读全文 »

1. Numpy概述

1.1 概念

Python本身含有列表和数组,但对于大数据来说,这些结构是有很多不足的。由于列表的元素可以是任何对象,因此列表中所保存的是对象的指针。对于数值运算来说这种 结构比较浪费内存和CPU资源。至于数组对象,它可以直接保存 数值,和C语言的一维数组比较类似。但是由于它不支持多维,在上面的函数也不多,因此也不适合做数值运算。Numpy提供了两种基本的对象:ndarray(N-dimensional Array Object)ufunc(Universal Function Object)。ndarray是存储单一数据类型的多维数组,而ufunc则是能够对数组进行处理的函数。

阅读全文 »

1. 使用Anaconda

Anaconda,中文大蟒蛇,是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖.可通过Anaconda下载。选择合适版本。

注意:一个python环境应当只安装一个版本的tensorflow,如果还需要安装其他版本的tensorflow,应该再创建一个python环境

阅读全文 »

0. 我的思考

两个可供突破的大方向:

  • 是否能推动深度学习的训练数据规模减小?
  • 怎么使得训练模型的结果更加精确。

资源:

  • kaggle机器学习竞赛
阅读全文 »

1. 步骤

  • 阅读大量文献:需要阅读该方向的经典论文和最新论文文献
  • 在阅读这些文献之后,需要自己提出一个具体的研究问题。
  • 制定详细的研究计划
  • 论文的写作和投稿

2. 论文检索与下载

正如前面所说的,阅读文献的选择应该是在你确定了一个大的研究方向之后,选择经典和最新的文献进行阅读其摘要是否与自己领域相关,相关都建议下载阅读,所谓经典和最新是指:

  • 经典(重要):高被引用的文献
  • 最新(重要):你所研究方向进一两年的最新成果,在此基础上提出你的具有创新性的研究小方向
  • 其他相关文献
阅读全文 »

1. Git是什么

Git 是一个开源的分布式版本控制系统,用于敏捷高效地处理任何或小或大的项目。Git原来是 Linus Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。

阅读全文 »

1. 为什么使用VScode

VScode是微软推出一个轻量化编辑器,只需要下载相应的编译器和包即可支持C/C++、java、python的编写。相对于VS来说,VScode更加的轻便、体积小,支持许多插件。

2. VScode的界面使用

阅读全文 »

1. get请求和post请求的区别

  • GET请求
    • 主要用途:用于从服务器获取资源或数据。GET请求是安全的和幂等的,意味着重复发送相同的GET请求,不会产生副作用(不会改变服务器状态)。
    • 数据传递:GET请求将数据附加在URL中,通过查询字符串(query string)传递,格式为?key1=value1&key2=value2
    • 数据大小限制:由于数据是附加在URL中的,浏览器对URL的长度有限制(通常是2048字符左右),因此GET请求适合传递少量数据。
    • 缓存:GET请求通常可以被浏览器缓存。
    • 安全性:由于数据在URL中显示,GET请求不适合传递敏感信息,如密码。
  • POST请求
    • 主要用途:用于向服务器发送数据,通常用于提交表单或上传文件,目的是提交数据以便进行处理(如数据库存储、数据更新等)。
    • 数据传递:POST请求通过请求体(body)传递数据,数据不会显示在URL中,因此可以传输大量数据。
    • 数据大小限制:POST请求数据量没有像GET那样的长度限制,理论上可以传输更大的数据。
    • 缓存:POST请求通常不会被缓存。
    • 安全性:相较于GET,POST请求在数据传输中更安全,因为数据不显示在URL中,但仍然建议通过HTTPS加密传输敏感信息。
阅读全文 »