(资料图片)
计算机视觉 ,是指计算机从图像中识别出物体、场景和活动的能力。计算机视觉技术运用由 图像处理 操作,及其他技术所组成的序列来将图像分析任务分解为便于管理的小块任务。
人脸相关(人脸识别转正关键点检测) 图像复原(去噪去雨去雾去模糊、超分、暗光增强) 图像补绘(Inpainting) 图像语义分割(Segmentation) 三维重建(即深度估计) 6D姿态估计 点云绘制 风格转换 OCR文本识别深度学习是机器学习研究中的一个新的领域,其动机在于建立可以模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如,图像、声音和文本。深度学习的目的是形成复杂算法和优势算法,属于无监督(Unsupervised)学习的一种。无监督学习的意思就是不需要通过人工方式进行样本类别的标注来完成学习。因此,深度学习是一种可以自动地学习特征的方法。
深度学习是利用多层感知器结构对非线性信息进行处理的一种学习方法。Hinton等首先提出了深度置信网络和相应的高效学习算法,该算法具有无监督学习的能力,降低了对人工的依赖,可以较为高效地进行训练,之后深度学习发展都是在此基础上进行改进的。目前深度学习方法在对自然语言处理方面的基本方向是通过对文档上下文进行学习训练,对于中文文档,还需要先进行中文分词处理,然后将文档中的词语、句子分别用连续实值向量进行表示,形成的向量称为嵌入向量,这样做是为了方便处理文本语义特征,将词语、句子用向量表示,在处理文本语义特征时,对词向量、句向量直接进行向量上的计算即可表征它们之间的文本语义关系。
自然语言处理 ,是指计算机拥有的人类般文本处理的能力。
机器学习 ,指的是计算机系统无需遵照显式的程序指令,而只是依靠暴露在数据中来提升自身性能的能力。其核心在于,机器学习是从数据中自动发现模式,模式一旦被发现便可用于做预测。
机器翻译 自然语言理解 语音识别 聊天机器人 摘要生成 情感识别(经典方法是TF-IDF) 超大型语言模型研究(典型的是GTP-2、GTP-3等)语音识别技术,主要是关注自动且准确的转录人类的语音。该技术必须面对一些与自然语言处理类似的问题,在不同口音的处理、背景噪音、区分同音异形异义词(“buy”和“by”听起来是一样的)方面存在一些困难,同时还需要具有跟上正常语速的工作速度。
数字图像理论
数字图像处理课程和课本、基础网课上机实操
初级工具:Keras(不灵活) + 李宏毅网课 正规工具:Pytorch 高级工具:TensorFlow/Caffe
免责声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。