当前位置: 首页 > news >正文

个人网站模板html 下载网销怎么做

个人网站模板html 下载,网销怎么做,科技公司注册需要什么条件,国外网站开发技术现状文章目录 1 基本概念2 基本流程2.0 数据获取2.1 预处理2.1.0 认识数据认识问题2.1.1 不平衡标签的处理a.随机过采样方法 ROS,random over-samplingb. SMOTE synthetic minority Over-Sampling Technique2.2 缺失值处理2.3 数据清洗2.3.0离散特征编码2.3.1 连续特征处理归一化标…

文章目录

  • 1 基本概念
  • 2 基本流程
    • 2.0 数据获取
    • 2.1 预处理
      • 2.1.0 认识数据
        • 认识问题
      • 2.1.1 不平衡标签的处理
        • a.随机过采样方法 ROS,random over-sampling
        • b. SMOTE synthetic minority Over-Sampling Technique
      • 2.2 缺失值处理
      • 2.3 数据清洗
        • 2.3.0离散特征编码
      • 2.3.1 连续特征处理
        • 归一化
        • 标准化
      • 特征工程

1 基本概念

机器学习,分为 回归,分类,聚类,降维
有监督学习 回归,分类, 有特征,有标签,进行训练,然后对新数据进行预测
无监督学习 聚类,降维。

题目越多,训练越好,

2 基本流程

数据预处理—— 模型训练与评估
可以优化为 获取数据——数据预处理——EDA 分析——特征工程——模型训练——可解释性分析

2.0 数据获取

利用 kaggle, 天池 等平台的 开源 数据,

2.1 预处理

目的:

  1. 让数据更符合逻辑
  2. 让数据更容易计算
    借助函数实现变换 or 运算

2.1.0 认识数据

常用 pandas 包,是 python 中一个强大的数据分析和处理库。
其可以

  1. 数据处理,对数据进行 清洗,转换,合并,分组等操作,处理缺失的和重复的数据。
  2. 数据读取和写入, 如 CSV 格式,excel, JSON, SQL 等
  3. 对数据进行时间序列分析,移动窗口统计等操作

** 部分常用 API **
import pandas as pd
读取数据
df = pd.read_csv(‘data.csv’)
查看数据
df.head()
显示数据集形状. (几行几列)
df.shape

查看数据集信息。 (特征的种类和标签)
Data.info
显示 data.frame 的详细信息,数据类型,每列数据类型,非空值数量

显示数据集的统计特征,
df.decribe()
count 非空值的数量
mean 均值
std 标准差
min 最小值
25% 第 25 %分位点, 就是 100组数据,25%在 25.
50%
max 最大值
unique 唯一值数量
top 出现频率最高的值
freq 最高频率出现次数

认识问题

机器学习: 特征 和 标签
说白了 输入 和 输出
工作 会称 这一对为 字段

2.1.1 不平衡标签的处理

在机器学习任务中,标签的均衡性会对模型的性能有重大影响。
主要是在 分类中。
若 各类样本的数量差异较大,则使得数据集不平衡,
会导致 数据集更偏向 多数类,从而影响少数类的预测性能。
比如说: 990张狗,10张猫
那么模型在 95%以上正确率时,可能会更偏向把猫全部认为成狗。

a.随机过采样方法 ROS,random over-sampling

就是 随机复制少数类样本,增加其数量,使各类样本区于平衡。
但是可能会导致模型过拟合,模型对少数样本的特征过于敏感。

如果数据过多,也能用 欠采样。

from imblearn.over_sampling import RandomOverSampler
# 定义随机过采样器,设置过采样倍数为 2
ros = RandomOverSampler(sampling_strategy=2, random_state=42)# 对数据集进行过采样
X_resampled, y_resampled = 
http://www.shuangfujiaoyu.com/news/22995.html

相关文章:

  • vue做社区网站百度指数数据官网
  • 做公司网站可以抄别人的吗简述seo
  • 百度推广网站域名费关键词排名网络推广
  • 美橙互联网站建设wordpress官网入口
  • 做购买网站推广接单平台
  • 邯郸市住房和城建设局网站最新病毒感染
  • 洛阳做网站的营销策略有哪些内容
  • 杨凯做网站黑帽seo技术论坛
  • 265内存装wordpress网站优化外包费用
  • 网站设计风格有哪些网络营销专业是干什么的
  • 开发高端网站开发互联网广告代理商
  • 网站每天做多少外链合适互联网营销顾问是做什么的
  • 建网站中企动力北京刚刚宣布比疫情更可怕的事情
  • 网站页面制作视频常德今日头条新闻
  • 顺德门户网站建设公司seo网站推广实例
  • 成都 企业 网站建设网站推广软件ky99
  • 天河做网站开发怎么让网站被百度收录
  • 佛山市国外网站建设公司谷歌网站优化推广
  • 网站公安备案多久审核友の 连接
  • 前端网站搜索导航怎么做广告公司业务推广
  • 做网站的颜色app推广是什么工作
  • 长沙点梦网站建设高级搜索技巧
  • 全国工厂的网站建设如何建立公司网站网页
  • 做外贸翻译用那个网站佛山seo代理计费
  • 网站分享图片怎么做百度一下首页下载安装桌面
  • 简单的网站模板高端网站设计
  • 成都网站建设火狐狸六六seo基础运营第三讲
  • 网站建设数字的代码编写攀枝花seo
  • 装修平台网站排名前十名长沙seo网站
  • 做货运代理网站网络软文写作