江南娱乐手机app下载De Anza标志 课程大纲

公共搜索


关闭窗口/标签
打印视图- - -打开新,第二个窗口。使用浏览器控件关闭完成后。
信贷度适用
有效的季度:2020年秋季

一、目录信息

独联体9
数据科学概论
4.5单元(s)

条件:先决条件:独联体41。

小时:Lec小时:48.00
实验室小时:18.00
类的小时:96.00
学生的学习总小时:162.00

描述:本课程是介绍数据科学,涵盖数据分析和机器学习。主题包括数据采集和数据争吵,和可视化数据评估,监督和非监督机器学习,自然语言处理。


学生的学习结果语句物资货柜

•学生的学习结果:收集、清洁、分析和可视化数据满足和捍卫一个测量目标。


•学生的学习结果:收集数据和选择一个模型训练和调整机器学习工具和解释结果


二世。课程目标

一个。 定义和描述数据的科学概念
B。 应用数学和统计数据构建块
C。 在数据科学应用编程结构
D。 收集来自多个数据源的数据
E。 应用数据争论技术
F。 评估数据集
G。 可视化并显示数据
H。 申请一个学习框架
我。 评估监督学习
J。 评估非监督学习
K。 评估自然语言处理

三世。必要的学生材料

没有一个

第四,大学必不可少的设施

计算机实验室的计算机运行Python解释器和蟒蛇包

诉扩展描述:内容和形式

一个。 定义和描述数据的科学概念
1。 数据分析的作用
2。 机器学习应用
B。 应用数学和统计数据构建块
1。 线性代数符号,向量和矩阵运算
2。 等统计数据,测量的意思是,中位数,模式,标准差,局外人,相关性,置信区间
C。 在数据科学应用编程结构
1。 数据结构
一个。 数组
b。 数据帧
2。 数据输入/输出
3所示。 运营商
4所示。 功能
5。 情节
D。 收集来自多个数据源的数据
1。 定义目标
2。 网页抓取
3所示。 Web API
4所示。 导入文件
一个。 HTML
b。 文本
c。 CSV
d。 JSON
E。 应用数据争论技术
1。 加入数据
2。 数据验证
3所示。 数据清理
F。 评估数据集
1。 探索性数据分析
2。 数据过滤、排序
3所示。 搜索、检索数据
4所示。 时间序列
G。 可视化并显示数据
1。 单变量和多变量的情节
2。 国防的结果
H。 申请一个学习框架
1。 加载数据集
2。 学习和预测
3所示。 保存模型
我。 评估监督学习
1。 训练,预测
2。 评估模型成功
J。 评估非监督学习
1。 聚类
2。 异常值检测
K。 评估自然语言处理
1。 基于规则和统计NLP
2。 情绪分析

VI。作业

一个。 阅读:从教科书和classnotes必读
B。 项目:6 - 8编程作业,几个100多行代码。

七世。教学方法

讲座和视觉辅助
指定阅读的讨论
讨论和解决问题在课堂上表演
课堂的探索网站
测验和考试复习在课堂上表演
作业和扩展项目
合作学习和小组练习
合作项目
实验室每周讨论会议和测验,评估程序实验室练习

八世。评估目标的方法

一个。 评估的编程作业和报告正确性,使用设计原则、文档和效率。
B。 一个或多个考试要求开发一个算法,编程能力评估代码段,并使用理论提出了在编写代码。
C。 课堂实验的问题,小组协作问题,试题和/或在线作业或教程展示了阅读能力通过调试和分析代码和/或编写的代码片段。
D。 期末考试要求开发算法的编程能力,评估代码段,并使用理论提出了在编写代码。

第九。文本和支持引用

一个。 主要文献和引用的例子
1。 Igual,劳拉和Segui,桑蒂:数据科学概论,第1版。不可靠的人。ISBN 978-3-319-50017-1。2017年
2。 萨尔兹,Jeffrey:介绍数据科学、1日版,圣人出版,ISBN: 978 - 1506377537, 2018
B。 支持短信和引用的例子
1。 个村落,特:统计学习的元素,第二版,施普林格,ISBN: 978 - 0387848570, 2017

x实验室的话题

一个。 现在,评估和解释的作用和应用程序数据科学在现代生活。
B。 解决数学和统计大型数据集的问题。
C。 编写代码来对输入数据进行数学和统计工作创造和呈现结果。
D。 编写代码来定位和读取数据从多个类型的数据源。
E。 编写代码加入、验证和清洁输入数据为分析做准备。
F。 编写代码来过滤,搜索、排序数据来得出一个结论的数据趋势。
G。 编写代码来使用适当的情节来可视化数据。
H。 编写代码来使用机器学习模型训练和预测数据。
我。 编写代码来提供输入数据的机器学习模型无监督学习。
J。 编写代码来处理文本和预测结果。



Baidu
map