Python 有好几种内置数值类型。数值类型非常有用,因为很多商业应用需要对数值进行分析和处理。Python 中最主要的 4 种数值类型是整数、浮点数、长整数和复数。x = 9print("Output #4: {0}".format(x))print("Output ...
常量是指直接写在程序中的值,包括数值、字符串等。数值型常量包括整型、单精度、双精度等,一般不需要区分。写法如123, 123.45, -123.45, -0.012, 1.23E2, -1.2E-2等。 为了表示123是整型,可以写成123L。字符型常量用两个双撇号或两个单撇号包围,如"L...
data.world 是世界上最大的协作数据社区,它是免费的,向公众开放。人们发现数据、共享分析,并合作处理从社交机器人检测到屡获殊荣的数据新闻等所有方面。包含有金融,犯罪,经济,推特,美国宇航局等的各种各样的数据集。来源网址:https://data.world
和整数一样,浮点数(即带小数点的数)对很多商业应用来说也是非常重要的。下面是几个带有浮点数的示例:print("Output #7: {0:.3f}".format(8.3/2.7))y = 2.5*4.8print("Output #8: {0:.1f}"....
在用source()调用源程序文件或者用read.csv()读入数据文件时, 如果不写文件名的全路径, 就认为文件位置是在所谓“当前工作目录”。 用getwd()函数可以查询当前工作目录, 用setwd()函数可以设置当前工作目录。 在RStudio中用菜单“Session–Set working ...
Kaggle是一个多功能网站,拥有著名的“数据科学社区”,数据集量大,内容丰富,它不仅提供各种外部共享的有趣数据集,还提供获取新知识和实践技能的材料,数据集支持检索查找,并且自己举办有奖金的比赛。来源网址:https://www.kaggle.com
Python 提供一个名为 type 的函数,你可以对所有对象调用这个函数,来获得关于Python 如何处理这个对象的更多信息。如果你对一个数值变量调用这个函数,它会告诉你这个数值是整数还是浮点数,还会告诉你这个数值是否能当作字符串进行处理。函数的语法非常简单: type(varible) 会返回 ...
源程序文件存在编码问题。 对于源程序编码与系统默认编码不同的情况, 在source()函数中可以添加encoding=选项。 例如, 保存为UTF-8编码的源程序在简体中文MS Windows系统的R中运行, 可以在source()函数中可以添加encoding="UTF-8"选...
平台拥有免费数据集和专门用于数据科学的丰富信息文章,他们使用硬数据和统计分析来讲述有关政治,体育,社会问题等的故事。来源网址:https://github.com/fivethirtyeight/data
字符串是 Python 中的另一种基本数据类型。它通常是指人类可以阅读的文本,但更广泛地说,它是一个字符序列,并且字符只有在组成这个序列时才有意义。很多商业应用中都有字符串类型的数据,比如供应商和客户的名字及地址、评价和反馈数据、事件日志和文档记录。一些对象看上去是整数,但实际上是字符串,比如邮政编...
用source()函数可以运行保存在一个文本文件中的源程序。 比如,如下内容保存在文件ssq.r中:sum.of.squares <- function(x){ sum(x^2)}用如下source()命令运行:source("ssq.r")运行后就可以调用自定义函数su...
BuzzFeed是一家提供新闻和娱乐内容的跨平台数字媒体公司,同时也提供免费数据集,是搜索机器学习和数据科学公共数据集的绝佳来源,可以在线获取不同主题 - 从顶级健身趋势和啤酒配方到农药中毒率。来源网址:https://www.buzzfeed.com
Python 中包含了 datetime 模块,它提供了非常强大的功能来处理日期和时间。要想在脚本中使用 datetime 模块提供的功能,需要在脚本上方加入 from datetime import date,time, datetime, timedelta ,放在之前的 import 语句下面...
数值型变量可以计算各种不同的统计量, 如平均值、标准差和各个分位数。 summary()可以给出最小值、最大值、中位数、四分之一分位数、四分之三分位数和平均值。如summary(tax.tab[["营业额"]])## Min. 1st Qu. Median Mean...
是一个大型数据集聚合器,是美国政府开放数据的所在地。有14个不同的主题(从农业,公共安全到地方政府),因此很有可能找到非常有趣的数据集。来源网址:https://www.data.gov
# 使用方括号创建一个列表# 用len()计算列表中元素的数量# 用max()和min()找出最大值和最小值# 用count()计算出列表中某个值出现的次数a_list = [1, 2, 3]print("Output #58: {}".format(a_list))print(...
R使用经常是在命令行逐行输入命令(程序), 结果紧接着显示在命令后面。 如何保存这些命令和显示结果? 在R命令行中运行过的命令会被保存在运行的工作文件夹中的一个名为.Rhistory的文件中。 用sink()函数打开一个文本文件开始记录文本型输出结果。 结束记录时用空的sink()即可关闭文件不再记...
UCI是机器学习方面最著之一名的数据存储库。如果正在寻找与机器学习库相关的数据集,通常是第一个去的地方。除此之外还包括各种各样的数据集,如Iris和泰坦尼克号的生存、空气质量和GPS轨迹等。 来源网址:https://archive.ics.uci.edu/ml/index.php
# 使用索引值访问列表中的特定元素# [0]是第1个元素,[-1]是最后一个元素print("Output #65: {}".format(a_list[0]))print("Output #66: {}".format(a_list[1]))print(&q...
命令行的计算结果直接显示在命令的后面。 在用source()运行程序文件时, 需要用print()函数显示一个表达式的结果,如:print(sin(pi/2))## [1] 1用cat()函数显示多项内容, 包括数值和文本, 文本包在两个单撇号或两个双撇号中,如:cat("sin(pi/2...