优化Python代码的4种方法

发布时间：2019-10-09 07:20:20 所属栏目：优化来源：人工智能遇见磐创

导读：介绍我是一个程序员。从大学时代开始我就一直在进行编程，而我仍然对使用简单的Python代码所开辟的道路之多感到惊讶。但是我并不总是那么高效。我相信这是大多数程序员(尤其是刚起步的程序员)共有的一个特征，编写代码的快感始终优先于效率和简洁性。虽

让我们使用Twitter情绪分析数据来计算每条推文的字数。我们将使用不同的方法，例如dataframe iterrows方法，NumPy数组和apply方法。你可以从此处下载数据集(https://datahack.analyticsvidhya.com/contest/practice-problem-twitter-sentiment-analysis/?utm_source=blog&utm_medium=4-methods-optimize-python-code-data-science)。

''' 
优化方法：apply方法 
''' 
# 导入库 
import pandas as pd  
import numpy as np 
import time 
import math 
data = pd.read_csv('train_E6oV3lV.csv') 
# 打印头部信息 
print(data.head()) 
# 使用dataframe iterows计算字符数 
print('nnUsing Iterrowsnn') 
start_time = time.time() 
data_1 = data.copy() 
n_words = [] 
for i, row in data_1.iterrows(): 
 n_words.append(len(row['tweet'].split())) 
data_1['n_words'] = n_words  
print(data_1[['id','n_words']].head()) 
end_time = time.time() 
print('nTime taken to calculate No. of Words by iterrows :', 
(end_time-start_time),'seconds') 
# 使用Numpy数组计算字符数 
print('nnUsing Numpy Arraysnn') 
start_time = time.time() 
data_2 = data.copy() 
n_words_2 = [] 
for row in data_2.values: 
 n_words_2.append(len(row[2].split())) 
data_2['n_words'] = n_words_2 
print(data_2[['id','n_words']].head()) 
end_time = time.time() 
print('nTime taken to calculate No. of Words by numpy array : ', 
(end_time-start_time),'seconds') 
# 使用apply方法计算字符数 
print('nnUsing Apply Methodnn') 
start_time = time.time() 
data_3 = data.copy() 
data_3['n_words'] = data_3['tweet'].apply(lambda x : len(x.split())) 
print(data_3[['id','n_words']].head()) 
end_time = time.time() 
print('nTime taken to calculate No. of Words by Apply Method : ', 
(end_time-start_time),'seconds')

（编辑：晋中站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

3/7

首页

尾页

搜索引擎排名受什么因	保持不懈做要害词自然
建议一个空间绑定一个	移动网站要害词排名能