当前位置:网站首页>【七夕如何根据情侣倾听的音乐进行薅羊毛】背景音乐是否会影响情侣对酒的选择
【七夕如何根据情侣倾听的音乐进行薅羊毛】背景音乐是否会影响情侣对酒的选择
2022-08-05 00:53:00 【晴天qt01】
目录
七夕活动特栏
简介
七夕到了,情侣也都就高档酒店了,我之前去酒店干过销售,这时候的销售业绩一般都不会差,但是如何从中脱颖而出呢,这就要说到酒吧的背景音乐了,有时,情侣会不点音乐,有时会点法国风的:French手风琴,也有些人会点意大利风的:italian手风琴,你销售的酒有French、italian、其他酒类
怎么样才能在这些小情侣的手中薅羊毛呢,这就得用到数据挖掘的特征选择了。
特征选择的方法
无效变量
不相关变量,多余变量
统计方式的特征选择方法如下
这边只说明几个
方差阈值化、卡方检验、ANOVA检验及T检验、皮尔森相关系数
高度相关特征的选择(多余变量)
模型方式的特征选择
决策树、逻辑回归,随机森林,XGBoost
模型会自动选择变量
递归式的特征选择。
将特征慢慢消除,限制到特定范围内。

当输入增加,就必须增加数据,不然模型就会不稳定
无效变量
不相关变量,多余变量

Redundancy:两个变量的相关性太高,说明1二者的概念可能是否接近,也就是多余变量,可以采取合并的方法。甚至删除字段,二者带来的信息
Irrelevancy:X4,X3就是不相关变量,X4变大时会发现目标值的变动。当X3变动的时候预测值是随机的,不相关,无法带来信息。

统计方式的特征选择
VT方差阈值化:算出数值型字段的方差,如果低于某个值,说明它包含的信息量不足。
方差不能事先对它进行标准化。比如Z-scold 它的方差为1,均值为0
必须决定一个门槛值,是否删除该字段
二元变量:把其中一个编码为1,一个编码为0方差就是P(1-P)(先做特征转换)

当方差越大,说明是越重要的字段。最大值是0.25。
当然,这个与目标无关
皮尔森相关系数:
高度相关特征的选择(多余变量):
经常会出现高度相关字段,带来的信息是重复的,利用皮尔森相关系数,查看二者的相关性。大于0.95就抹除变量。
要看保留那个,可以求变量1和变量2与目标的关系。
统计检验的方式:
输入字段与目标字段的关系
类别型字段:卡方检验:输入字段与目标字段的关联性
数值型字段:ANOVA检验(目标字段大于2就行):T检验(目标字段只有2个值,比如yes or no):来检验输入字段与目标字段的关联性。
ANOVA案例:背景音乐是否会影响消费者心情。音乐(输入字段)与酒类购买的关系。
无音乐,French手风琴,italian手风琴
酒:French、italian、其他酒类
统计量

真实销售减去期望值求和除以期望值求和


这是期望频数。设二者相互独立,概率1乘以概率2,乘总数243.
上表减下表,平方之和,除以均值之和
得到的值越大越好。对比的数值可以查卡方统计表,
先计算其卡方值,利用该值查表,对应的概率,如果小于显著性水平0.05,说明二者无关的概率极小,予以排除。
结论
那么我们就可以得出酒和音乐的相关性很大,那么我们就可以对它进行实际薅羊毛了,当情侣听的是意大利风格的手风琴时我们就卖意大利酒,French手风琴,就卖French酒,那么我们就对症下药,薅它们羊毛。
边栏推荐
- Software Testing Interview Questions: What do test cases usually include?
- 码率vs.分辨率,哪一个更重要?
- MBps与Mbps区别
- ora-01105 ora-03175
- The method of freely controlling concurrency in the sync package in GO
- matlab 采用描点法进行数据模拟和仿真
- Lattice PCIe Learning 1
- 二叉树[全解](C语言)
- 蓝牙Mesh系统开发四 ble mesh网关节点管理
- The principle of NMS and its code realization
猜你喜欢

OPENWIFI实践1:下载并编译SDRPi的HDL源码

新唐NUC980使用记录:在用户应用中使用GPIO

Jin Jiu Yin Shi Interview and Job-hopping Season; Are You Ready?

B站7月榜单丨飞瓜数据B站UP主排行榜发布!

Lattice PCIe Learning 1

多线程涉及的其它知识(死锁(等待唤醒机制),内存可见性问题以及定时器)

【FreeRTOS】FreeRTOS与stm32内置堆栈的占用情况

JUC thread pool (1): FutureTask use
![Binary tree [full solution] (C language)](/img/4d/2d81dc75433c23c5ba6b31453396f0.png)
Binary tree [full solution] (C language)

蓝牙Mesh系统开发四 ble mesh网关节点管理
随机推荐
深度学习:使用nanodet训练自己制作的数据集并测试模型,通俗易懂,适合小白
JWT简单介绍
Software testing interview questions: Have you used some tools for software defect (Bug) management in your past software testing work? If so, please describe the process of software defect (Bug) trac
ORA-00257
Software testing interview questions: What is the difference between load testing, capacity testing, and strength testing?
Creative code confession
僵尸进程和孤儿进程
软件测试面试题:测试生命周期,测试过程分为几个阶段,以及各阶段的含义及使用的方法?
新唐NUC980使用记录:在用户应用中使用GPIO
2022牛客多校训练第二场 J题 Link with Arithmetic Progression
Lattice PCIe 学习 1
Dynamic Programming/Knapsack Problem Summary/Summary - 01 Knapsack, Complete Knapsack
### Error querying database. Cause: com.mysql.jdbc.exceptions.jdbc4.MySQLNonTransientConnectionExcep
张驰咨询:揭晓六西格玛管理(6 Sigma)长盛不衰的秘密
Knowledge Points for Network Planning Designers' Morning Questions in November 2021 (Part 1)
JUC thread pool (1): FutureTask use
Software test interview questions: BIOS, Fat, IDE, Sata, SCSI, Ntfs windows NT?
oracle create user
Countdown to 1 day!From August 2nd to 4th, I will talk with you about open source and employment!
Gartner Hype Cycle:超融合技术将在2年内到达“生产力成熟期”