由Cloudera提供的一系列大数据相关证照~
1. CCP Data Engineer
资料收集: 如何收集和提取来自不同数据源的数据。
资料转换: 数据的转换、清理和準备,以供分析和存储。
资料储存: 使用Hadoop文件系统(HDFS)等储存大量数据的技术。
资料处理: 使用MapReduce、Spark等工具进行数据处理和分析。
资料安全和备份: 数据的安全、备份和恢复。
资料传输和集成: 不同系统之间的数据传输和集成。
2. CCP Machine Learning
特徵工程: 如何从原始数据中提取和选择特徵,以便于机器学习算法使用。
模型训练和评估: 使用机器学习算法进行模型训练,并进行性能评估和优化。
模型部署和运营: 如何部署机器学习模型并持续监控和维护。
3. CCP Data Scientist
资料準备: 数据的收集、清理、转换和準备。
探索性数据分析(EDA): 通过统计方法和视觉化工具来探索数据。
特徵工程: 从原始数据中提取和选择特徵。
模型训练和评估: 使用机器学习算法进行模型训练,并进行性能评估和优化。
模型部署和运营: 如何部署机器学习模型并持续监控和维护。