蓝桥杯项目实战赛——人工智能赛道备赛建议

前言

    因为该赛道是第一届,对于考核内容,考核方式,该如何备赛都不清楚。本人在将所有模拟赛的题目认真练习后,在实际比赛时发现效果并不好。因此决定将自己赛后的想法整理成文档,以让后人少走弯路。

正文

15届比赛规则
点击查看

参赛建议

  • 初学者不建议参赛,该比赛考察范围较广,短期无法学会所有知识点.除非你真的是天才
  • 对机器学习和深度学习算法有一定的了解经验
  • Python编程水平较好(主观上)

一定要基于大纲知识点备赛!!!

一定要基于大纲知识点备赛!!!

一定要基于大纲知识点备赛!!!

    目前由于该赛道成立时间短,题库里的题目比较少,单纯刷题并没有太大的作用。做题目更适合去验证自己当前的编码水平。按照不同的模块,下面我会具体介绍需要学习的内容和推荐的学习博客。

数据预处理

数据(数值、文本、图像等)清洗、异常值检测与处理、数据转换、数据标准化/归一化、数据不均衡处理、特征提取等数据处理技术。

  • 不同类型的数据该如何读取:
    不同类型的数据可以使用不同的方法来读取。例如,结构化数据(如CSV文件)可以使用Pandas库中的read_csv函数来读取,而图像数据可以使用OpenCV或Pillow库来读取,文本数据则可以使用Python内置的文件读取功能或者更高级的文本处理库如NLTK或Spacy。读取数据时要考虑数据的格式和特点,选择合适的读取方法。

  • 不同类型数据之间的转换:
    数据之间的转换取决于数据类型和目标。例如,将文本数据转换为数值数据可以使用词袋模型或TF-IDF向量化;将时间序列数据转换为特征向量可以使用滚动统计特征等方法。每种类型的数据都有相应的转换方法,需要根据具体情况选择合适的转换技术。

  • 数据清洗:
    数据清洗是指对数据中的错误、不完整或不一致的部分进行识别和处理的过程。常见的数据清洗操作包括处理缺失值、处理异常值、去除重复数据、修正数据错误等。

  • 特征提取:
    特征提取是将原始数据转换为更具代表性和可解释性的特征的过程。在机器学习和数据分析中,特征提取是非常重要的步骤。它可以帮助模型更好地理解数据并提高预测性能。常见的特征提取方法包括基于统计的方法、基于信息论的方法、基于降维的方法等。

参考链接:

数值型预处理

图像处理

特征提取

模型训练与评估

线性回归、逻辑回归、决策树、朴素贝叶斯、随机森林等常见的传统机器学习算法应用;卷积神经网络(Convolutional Neural Networks, CNN)、循环神经网络(Recurrent Neural Networks, RNN)、长短期记忆网络(Long Short-Term Memory, LSTM)、自编码器(AutoEncoders)、生成对抗网络(Generative Adversarial Networks, GAN)、等深度学习模型应用;Scikit-learn机器学习库应用、Tensorflow、Keras、Pytorch深度学习框架应用;模型效果评估,包括准确率、精确率、召回率、F1分数、R-squared、均方误差等模型性能评估指标计算方法。

这一部分涉及的内容非常多,同时分数足足有50分。主要就是如何构建、训练、评价模型。

  • 其中算法和模型的原理可以去看西瓜书和花书

  • 涉及到Tensorflow、Keras、Pytorch深度学习框架,建议b站或者中国大学MOOC自学

  • 评价指标sklearn库以及深度学习框架有内置的方法,调用即可

  • 实战经验非常重要,一边学一边试着写代码去实现模型的构建、训练、预测

参考链接:

TensorFlow 入门实操课程

机器学习知识点全面总结

模型应用部署

ONNX模型转换、TensorFlow Lite模型转换;Flask框架应用;Gradio模型部署;模型压缩;模型量化;模型输出后处理。

模型在训练出来后,如何进行处理、量化、压缩、部署到web网页等。

  • ONNX是一个用于表示深度学习模型的标准,可使模型在不同框架之间进行转移。

  • TensorFlow Lite 是一个移动端库,可用于在移动设备、微控制器和其他边缘设备上部署模型。

  • Flask是一个Python编写的Web 微框架,让我们可以使用Python语言快速实现一个网站或Web服务

  • Gradio是一个用于构建交互式界面的Python库。它可以快速创建自定义的Web界面,用于展示和测试机器学习模型、自然语言处理模型、计算机视觉模型等。

参考链接:

Flask框架入门

Gradio:建立机器学习网页APP

ONNX 基础知识

Tensorflow Lite入门

    整个比赛涉及的内容虽然多,但题目并不会特别难,对于记不住的api可以使用tap自动补全,按住ctrl+鼠标左键点击方法可以进入到方法的定义界面,可以查看函数的使用方法。

    本文就到这了,如有问题欢迎指正!祝各位同学都能拿国奖😊

Logo

更多推荐