第一个使用Python完成的数据化运营案例——销售预测

数据概述:第一列是促销费用;第二列是商品销售量。

<>读取文件

读取data文件
import re import numpy from sklearn import linear_model from matplotlib import
pyplotas plt fn = open('data.txt','rb') all_data=fn.readlines() fn.close()
<>数据写入
# x=[] # y=[] # for single_data in all_data: # print(single_data) # tmp_data =
re.split('\t|\n', single_data) # print(tmp_data) # x.append(float(tmp_data[0]))
# print(tmp_data) # y.append(float(tmp_data[1])) # print(tmp_data) # x =
numpy.array(x).reshape([100, 1]) # y = numpy.array(y).reshape([100, 1]) import
pandasas pd df = pd.read_csv('data.txt',dtype='float',delimiter='\t') df.head()
28192.0 68980.0
0 39275.0 78875.0
1 34512.0 81400.0
2 24430.0 80624.0
3 23811.0 65562.0
4 34856.0 94603.0 x=df.iloc[:,0].values.reshape(-1,1) y=df.iloc[:,1].values.
reshape(-1,1)
<>数据分析展示
plt.scatter(x,y)

<>数据建模
#线性回归分析 model=linear_model.LinearRegression() model.fit(x,y)
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False)
# 得到评估结果 model_coef=model.coef_ model_intercept=model.intercept_ r2=model.score(
x,y) #相关性系数 print(r2) #拟合的a print(model_coef) #拟合的b print(model_intercept)
0.7873031585790161 [[2.09300087]] [13260.03313486] # 销售预测 import numpy as np
new_x= 84610 new_x = np.array(new_x).reshape(1, -1) pre_y = model.predict(new_x)
print(pre_y) [[190348.83636364]] #拟合直线参数 x_train=x y_pre_train=model.predict(
x_train) # 数据分析展示 plt.scatter(x, y) #散点图 plt.plot(x_train,y_pre_train,color=
"red",linewidth=2) #拟合直线

技术
©2019-2020 Toolsou All rights reserved,
C#/.NET 系统优化专题(redis第六篇 数据结构【List】)org.postgresql.util.PSQLException 处理记录习题11-5 指定位置输出字符串python 动态规划求解单源最短路径华为鸿蒙操作系统有哪些特点和优势?余承东《全场景时代 新体验与新生态》演讲全文(精华)2020年8月15日 redis数据库 StackExchange.Redis中Set类型(C#版)(精华)2020年6月26日 C#类库 Enum(扩展方法) 云计算的最大安全风险:安全责任不清指定位置输出字符串(详细解析)415状态码到后台错误