系统软件 应用软件 图形软件 行业软件 安全相关 网络软件 聊天软件 影音软件 教育教学 驱动工具 编程开发 插件下载 源码下载 APP电脑版 其他类别

Tablesaw官方版

v0.38.1

Tablesaw官方版

  • 软件大小:15.7 MB
  • 软件语言:简体中文
  • 软件授权:共享软件
  • 软件类型:应用软件
  • 软件平台:WinAll
  • 更新时间:2022-02-09 14:31
  • 星级评分:4级
  • 软件官网:https://www.downza.com/
好评:50%顶一个
坏评:50踩一个

Tablesaw简介

Tablesaw提供数据分析和统计功能。该软件可以建立各种统计表进行数据分析,支持偏斜度、峰值、中值、产品值、平均值等多种统计分析功能,让用户在分析科学数据时获得可视化的图形统计结果。可以直接将本地的数据导入软件进行分析,也可以将数据库的内容添加到Tablesaw分析中,对表格数据进行排序。Tablesaw结合了处理表和列的工具,具有创建统计模型和可视化效果的能力,其中每一列包含一种数据类型,而行可以包含多种类型,为用户可视化科学数据提供了更多帮助!

Tablesaw软件功能

Tablesaw是数据科学的Java。它包括一个数据框架和一个可视化库,以及用于加载、转换、过滤和汇总数据的实用程序。记忆快速而谨慎。如果使用Java处理数据,可以节省时间和精力。Tablesaw还支持描述性统计,并与Smile机器学习库很好地集成在一起。

Tablesaw功能:

数据处理和转换

从RDBMS、Excel、CSV、ON、HTML或定宽文本文件导入数据,无论这些文件是本地文件还是远程文件(http、S3等)。)

将数据导出为CSV、ON、HTML或固定宽度文件。

通过附加或合并表格

添加和删除列或行。

排序、分组、查询

映射/归约操作

处理缺失值

Tablesaw软件特色

形象化

Tablesaw通过为Plot.ly JavaScpt图片库提供包装来支持数据可视化。

统计资料

描述:平均值、最小值、最大值、中值、总和、乘积、标准差、方差、百分位、几何平均值、偏斜度、峰度等。

Tablesaw教程

Tablesaw开始

Java是一门伟大的语言,但它不是为数据分析而设计的。通过Tablesaw,可以轻松使用Java进行数据分析。

本教程将帮助您入门和运行,并介绍Tablesaw的一些基本功能。

建立

首先,Tableasaw需要Java 8或更高版本。

其次,您需要将依赖项添加到pom文件中。它在Maven Central上提供。

设置好就行了。上部设计

表格和列

正如您所料,Tablesaw都是关于表的,而表是由列组成的。我们将从专栏开始。

列被命名为一维数据。它可能是也可能不是表的一部分。列中的所有数据必须属于同一类型。

Tablesaw支持以下列:字符串、浮点数、双精度数、整数、短裤、多头、布尔值、LocalDates、LocalTimes、Instant和LocalDateTimes。周期和时间列与Java 8中引入的java.time类相当。

要创建列,可以使用其静态()方法之一:

每列都有一个关联的从0开始的索引。若要获取单个值,请调用带有索引的get()。

双三= NC . get(2);

回到3.0。

数组运算

Tablesaw使该列易于使用。例如,那些在标准Java中处理数字的人通常在Tablesaw中处理数字列。要将一列中的每个值乘以4,我们使用乘法()方法,该方法将返回与原始列相同的新列。

如您所见,这些值是原始值的四倍。新列的名称是通过组合原始的“Test”和(* 4)获得的。如果你愿意,你可以改变它的名字。

通常,Tablesaw中有很多列,因此如果您发现自己编写了一个for循环来处理列或表,可能会丢失一些内容。

和对象原语。

许多Java程序和程序员只使用对象而不是原语。在Tablesaw中,因为它们使用了更多我们经常使用的原语,而内存比盒装的少。例如,即使Bytes的范围只有256个值,byte对象使用的内存也和原来的double一样多。

这种节俭是有代价的。在使用原语时,您将放弃一些常见的Java函数,例如使用标准的Java 8谓词。虽然Java周到地提供了一些专门的谓词接口(比如IntPredicate),但是它们并没有提供任何原始的bipredict实现,它们的原始接口也没有覆盖所有的原始类型。没有IntBiPredicate,我们无法实现它。

这仅涵盖了相关专栏的基础知识。您可以在“columns”部分找到更多,也可以在api包和columns包的Javadocs中找到更多。

选择权

在去餐桌前,我们应该谈谈选择。选择要筛选的表和列。它们通常在后台运行,但您可以直接使用它们。例如,假设我们的双列包含值{1,2,3,4}。您可以通过发送消息来筛选此列。示例:

NC . IslesShan(3);

这将返回选择。从逻辑上讲,它是一个与原始列大小相同的位图。上述方法有效地返回1、1、0、0,因为该列中的前两个值小于3,后两个值不小于3。

您可能想要的不是一个选择对象,而是一个新的对象,它有一个双列,只包含通过筛选的值。为此,可以使用where(aSelection)方法应用选择:

分两步做有很多好处。首先,它允许我们组合过滤器。示例:

double column filtered position = NC . where(NC . islesthan(3))。和(NC . isposive()));

如果方法直接返回列,则不能以这种方式组合它们。这也使我们能够使用相同的方法来过滤表和列,如下所示。

按索引选择

这些示例说明了如何使用谓词进行选择。您还可以使用selection检索一个或多个特定索引的值。支持以下两项:

如果您有几个与数据表长度相同的列,您可以选择其中一个列,并使用它来筛选另一个列:

重要提示:请注意start with(aStng)、islesthan(number)和isPositive()方法。这些是为您预先定义的。有许多这样的方法可以用来构建查询。对于StngColumn,它们是在tech . table aw . columns . stg ngs . stng filters的接口中定义的,它还包括endsWith()、isEmpty()、isAlpha()、containssting () 1等。每一列都有一组相似的过滤器。它们都可以在位于tech . table aw . columns(例如,tech . table aw . columns . date . datefilters)子文件夹中的筛选器界面中找到。

地图功能

映射函数是在列上定义的方法,它将新列作为结果返回。您已经看到了一个:上面的列乘法(Number)方法是一个带有标量参数的映射函数。要将两列中的多个值相乘,请使用乘法(NumberColumn):

nc1列中的每个值都乘以nc2中的相应值,而不是前面示例中的标量值。

各种列类型都有许多内置的映射函数。以下是StngColumn的一些示例:

如您所见,对于许多返回新Stng的Stng方法。StngColumn提供了一个等价的映射方法,该方法返回一个新的StngColumn。它还包括在番石榴的Stng库和Apache Commons Stng库中找到的其他有用的方法。

要点:每种行类型都有一组映射,比如乘法(Number)。使用StngColumn,这些方法是在tech . table aw . columns . stgngs . stngmap functions的接口中定义的,除了上面显示的方法,还包括很多方法。所有列类型的方法都可以在位于tech . table aw . columns(如tech)子文件夹中的筛选器界面中找到。table aw . columns . date . datemapfunctions,它提供了最新的方法,如plusDays(ANINT)、year()和month())。

缩小(汇总)功能:汇总一列。

有时,您希望导出一个值,从某种意义上总结列中的数据。这就是聚合函数的作用。每个这样的函数扫描列中的所有值,并返回单个标量值。所有列都支持一些聚合函数:min()和max(),如加号()、countUnique()和countMissing()。有些还支持特定类型的函数。例如,布尔值支持all(),如果所有列中的值都为true,则返回true。如果此列中的值为真或不为真,函数any()和none()将分别返回真。countTrue()和countFalse()函数也可用。

NumberColumn有更多聚合函数。例如,要计算列中值的标准偏差,请调用:

double stdDev = NC . standard deviation();

要点:NumberColumn支持许多聚合函数,包括许多最有用的函数。可用总和、计数、平均值、中位数、百分位数(n)、范围、方差、对数总和等。这些是在NumecColumn类中定义的。

当我们讨论下表时,我们将展示如何根据一个或多个分组列中的值计算一个或多个数值列中的小计。

桌子

是列的名称。虽然允许缺少值,但表中的所有列必须具有相同数量的元素。表可以包含任何列类型的组合。

创建表格

您可以用代码创建一个表。在这里,我们创建一个表,并向其中添加两个新列:

输入数据

更常见的是,您将从CSV或其他分隔文本文件中加载表格。

Table bushTable = Table.read()。CSV(& # 8220;../data/bush . CSV & # 8221;);

Tablesaw擅长猜测很多数据集的列类型,但是如果猜错了,或者可以提高性能,可以指定。还有许多其他可用的选项,例如指定是否有标头、使用非标准分隔符、提供自定义缺失值指示符等。

注意:加载数据有时是数据分析中最困难的部分。导入数据的文档中描述了加载数据的高级选项。本节还展示了如何从数据库、流或HTML表中读取数据。流接口使您能够从网站或S3桶中读取数据。

探索表

因为Tablesaw擅长处理表格,所以我们会尽可能多地使用它们。当您向tableaw询问一个表的结构时,答案将以另一个表的形式返回,其中一个表包含列名,依此类推。方法结构(),形状(),第一个(n)和最后一个(n)可以帮助您理解新的数据集。这里有一些例子。

Table的toStng()方法返回一个类似于上面所示的Stng表示。默认情况下,它返回的行数有限,但您也可以使用table.pntAll()或table.pnt(n)来获得所需的输出。

当然,这只是探索数据分析的开始。您还可以使用数字和可视化工具来浏览数据。这些工具分别在关于统计和绘图的文档中进行了描述。

使用表格的列

通常,您将使用表中的特定列。以下是一些有用的方法:

在tablesaw中,列名不区分大小写。如果您要求以下任何一项,您将获得相同的列:

记住列名就够了,但你不必确切记住大写哪个字符。

从表中获取特定的列类型。

您可以按名称或位置从表中检索列。最简单的方法column()返回一个Column类型的对象。这可能已经足够好了,但是通常您希望获得特定类型的列。例如,您需要将返回值转换为数字列,以便在散点图中使用它的值。

当变量类型为“列”时,它只提供对所有列都可用的方法。不能直接对列类型执行数值计算或字符串替换。如果需要StngColumn,可以对其进行转换,例如:

StngColumn sc =(StngColumn)table . column(0);

该表还支持直接返回所需类型的列的方法:

要点:您可能想要使用特定类型的列。使用标准的column()方法并转换结果,或者使用特定于类型的方法之一为您处理转换(例如,numberColumn())。还有一些方法或获取特定类型的列。

工艺线

像列一样,有许多选项可以处理行中的表。这里有一些有用的:

您也可以对表中的每一行做任何您想做的事情。一种方法是遍历行并分别处理每一列。

另一种方法允许您跳过迭代,并且每行只提供一个使用者。

如果您需要一次处理多行,有几种方法可以帮助您。

收起介绍展开介绍
  • 安卓合集
  • 软件合集
  • 浏览器
  • 电脑管家
  • 安卓游戏
更多 >> 安卓合集安卓合计

热门推荐

装机必备软件