海量跨媒体分析(博士生课程)


西北大学信息学院

2023年春季学期

时间 后九周,周二14:00-18:00
地点 长安校区2204
教师 罗迒哉
邮件 hzluo (at) nwu (dot) edu.cn
办公室 信息学院J601
答疑(Office Hour) 预约

通知

课件

传统方法参考材料 深度方法演讲主题
  • 课程介绍

cma.ppt

  • 课程PPT

百度网盘   提取码: vg7q

参考资料:https://nlp.stanford.edu/IR-book/(请自行下载电子版)

大数据培训班 2017年课程    2012年机器学习

数据挖掘课程  参考书:Introduction to Data Mining

Mean-Shift 算法

英语分词(tokenize)的flex源程序:下载源程序       可执行文件

分词的参考资料:英语lexicon的资料       有关中文分词的论文

通过元数据特征提取照片语义的参考文献:

Classification and annotation of digital photos using optical context data

Segmenting Photo Streams in Events Based on Optical Metadata

失衡样本的处理:

The class imbalance problem: A systematic study

The class imbalance problem in learning classifier systems: a preliminary study

特征选择:

Information gain tutorial

JMLR Special Issue on Variable and Feature Selection

An Introduction to Variable and Feature Selection

分类训练算法:

方程组求解

神经网络  神经网络参考代码

SVM   LibSVM   SVMLight   SVM介绍(直接下载PDF:链接)

VC Dimension

决策树

EM及其变种:

中文的EM算法介绍 直接下载  直接阅读

SMEM Algorithm for Mixture Models 链接2

投影追踪:

A Projection Pursuit Algorithm for Exploratory Data Analysis

New approximations of differential entropy for independent component analysis and projection pursuit

回归

几种参数式回归算法介绍   kNN回归 土石方距离(Earth Mover's Distance)

聚类分析

Cluster Analysis: Basic Concepts and Algorithms   PPT

信息可视化

Information Visualization Introduction  Large Scale Information Visualization  

弗吉尼亚理工的信息可视化课程

案例1:Mobius变换

案例2:分子生物学演示 直接下载

  • 深度学习基础:黄文君

介绍:论文课程, 深度学习简介运行环境安装

图像:Deep residual learning for image recognition

编码器/解码器结构:Encoder-decoder with atrous separable convolution for semantic image segmentation

  • 深度学习演进:葛兴

迁移学习:Transfer LearningA Comprehensive Survey on Transfer Learning

GAN:GAN PPTGAN介绍Generative Adversarial Networks

  • 深度大模型基础:王晨霁

介绍:深度大模型基础

Transformer/Attention:Transformer, Attention Is All You Need

BERT:BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

扩散模型:Diffusion Models, Diffusion Models Beat GANs on Image Synthesis, Diffusion Models: A Comprehensive Survey of Methods and Applications

  • 语言类深度大模型(GPT系列):闫龙泉

开端:Language Models are Few-Shot Learners

演化(问答系统):LaMDA: Language Models for Dialog Applications, WebGPT: Browser-assisted question-answering with human feedback, Improving alignment of dialogue agents via targeted human judgements, Improving Language Models by Retrieving from Trillions of Tokens

现状:Scaling Language Models: Methods, Analysis & Insights from Training Gophe, PaLM: Scaling Language Modeling with Pathways

  • 视觉类深度大模型:高志泽樟

商汤公开课

开端:ViT Vision Transformer, Swin Transformer, VMODE

现状:CoAtNet, CoCa

通用模型架构:商汤INTERN, 百度文心UFO 2.0, 华为盘古CV大模型

课程项目

致谢

本课程使用Christopher D. Manning, Prabhakar Raghavan和Hinrich Schütze所著教材《Introduction to Information Retrieval》作为参考资料,部分幻灯片使用教材所附课件材料。