Apache Superset软件下载_Apache Superset官方版下载-创佳软件园

软件介绍
相关专题
下载地址

Apache Superset简介

Apache Superset提供了数据库可视化开发功能，可以让你在图表上显示你的数据供本软件分析，让用户快速可视化复杂数据并为数据分析提供帮助，使用数据可视化数组探索你的数据，通过交互式仪表盘查看任何数据，提供丰富的仪器内容，显示不同的数据图表，自定义图表类型。您可以使用SQL Lab编写查询来探索数据，支持大多数常见的数据库，包括MySQL、SQL Server和SQLite，并满足用户可视化数据库的需求。超集有很多功能。您可以通过导入相关数据来创建图表和仪表板，以执行可视化设计！

Apache Superset软件功能

超级套装提供:

直观的界面，用于可视化数据集和制作交互式仪表板。

各种美丽的可视化显示您的数据。

用于提取和呈现数据集的无代码可视化构建器

用于准备可视化数据的世界一流的SQL IDE，包括丰富的元数据浏览器。

轻量级语义层使数据分析师能够快速定义自定义维度和指标。

为大多数讲SQL的数据库提供现成的支持。

无缝内存异步缓存和查询

一种可扩展的安全模型，允许您配置关于谁可以访问哪些产品功能和数据集的非常复杂的规则。

与主认证后端(数据库、OpenID、LDAP、OAuth、REMOTE_USER等)的集成。)

添加自定义可视化插件的功能

编程定制的应用编程接口

云原生架构，专为扩展而设计。

超集是云原生的，旨在提供高可用性。它被设计成可扩展到大规模分布式环境，并且可以在容器中很好地工作。虽然您可以在中等设置下或仅在笔记本电脑上轻松测试超集驱动器，但扩展平台几乎没有限制。

灵活地说，超集也是云原生的，允许您选择:

网络(Gunicorn，Nginx，Apache)，

元数据数据库引擎(MySQL、Postgres、MaaDB等。),

消息队列(Redis、RabbitMQ、SQS等。),

结果后端(S3、Redis、Memcached等。),

缓存层(Memcached、Redis等。),

超集还可以很好地与NewRelic、StatsD、DataDog等服务协同工作，可以为大多数流行的数据库技术运行分析工作负载。

目前，超集已经在很多公司大规模运行。例如，Superset在Kubernetes的Airbnb生产环境中运行，每天为600多名活跃用户提供服务，每天查看超过10万张图表。

Apache Superset软件特色

超集快速、轻量且直观，具有多种选项，因此具有各种技能的用户可以轻松浏览和可视化他们的数据，从简单的折线图到高度详细的地理空间地图。

1.功能强大但易于使用

使用我们简单的无代码可视化构建器或最新的SQL IDE，我们可以快速轻松地集成和浏览数据。

2.与现代数据库集成

超集可以通过SQLAlchemy连接到任何基于SQL的数据源，包括PB级的现代云原生数据库和引擎。

3.现代建筑

超集是轻量级和高度可扩展的，并且可以利用现有数据库体系结构的功能，而无需额外的提取层。

4.丰富的可视化和仪表板

超集自带各种精美的可视化效果。我们的可视化插件架构使得直接在Superset中构建自定义可视化变得容易。

Apache Superset教程

创建您的第一个仪表板

本节重点介绍最终用户(数据分析师、业务分析师、数据科学家等)的文档。)谁将使用超集进行数据分析和工作流探索。

本教程面向希望在超集中创建图表和仪表板的人。我们将向您展示如何将超集连接到新数据库，以及如何配置数据库中的表进行分析。您还将浏览公共数据并将可视化添加到仪表板中，以了解端到端用户体验。

连接到新数据库

超集本身没有存储数据的存储层，而是与现有的SQL数据库或数据存储配对。

首先，我们需要将连接凭证添加到您的数据库中，以便我们可以查询和可视化其中的数据。如果您通过Docker compose在本地使用超集，则可以跳过此步骤，因为Postgres数据库(命名示例)已经包含在超集中，并且已经为您预配置。

在数据菜单下，选择数据库选项:

接下来，单击右上角的绿色+数据库按钮:

您可以在此窗口中配置许多高级选项，但是对于本演练，您只需要指定两件事(数据库名称和SQLAlchemy I):

如下面的文本I中所述，您应该参考SQLAlchemy文档为目标数据库创建一个新的连接I。

单击“测试连接”按钮，确认一切正常。如果连接看起来良好，请通过单击模态窗口右下角的添加按钮保存配置:

恭喜，您刚刚在超集中添加了一个新的数据源！

注册新表格

现在您已经配置了数据源，您可以选择一个特定的表(在超集中称为数据集)进行查询。

导航到数据数据集，并选择右上角的+dataset按钮。

一个模态窗口应该会在你面前弹出。使用显示的下拉列表选择您的数据库、模式和表。在下面的示例中，我们注册了示例数据库中的cleaned _ sales _ data表。

要完成，请单击右下角的添加按钮。现在，您应该会在数据集列表中看到您的数据集。

自定义列属

现在您已经注册了数据集，您可以配置列属以了解如何在发现工作流中处理列:

专栏是临时的吗？(是否应该用于时间序列图中的切片和划片？)

该列应该是可过滤的吗？

是列维度吗？

如果是日期时间列，超集应该如何解析日期时间格式？(使用ISO-8601字符串模式)

设置语义层

超集有一个薄薄的语义层，可以为分析师增加很多生活质量。超集语义层可以存储两种类型的计算数据:

1.虚拟指示器:您可以编写SQL查询来汇总多个列中的值(如SUM(已恢复)/SUM(已确认))，并使它们作为列(如recovery_rate)可用，以便在Explore中可视化。并鼓励使用聚合函数作为指标。

如果您想在这个视图中为您的团队服务，您也可以验证指示器。

2.虚拟计算列:您可以编写SQL查询来自定义特定列的外观和行为(例如将CAST(recovery_rate)设为float)。计算中不允许使用聚合函数。

在“浏览”视图中创建图表

超集有两个浏览数据的主要界面:

探索:没有代码可视化生成器。选择数据集，选择图表，自定义外观，然后发布。

SQL实验室:用于为“探索”工作流清理、连接和准备数据的SQL IDE

现在，我们将重点关注用于创建图表的浏览视图。要从数据集选项卡启动发现工作流，首先单击将为图表提供动力的数据集的名称。

现在，您将获得一个强大的工作流来浏览数据并在图表上迭代。

左侧的数据集视图有一个列和指示器列表，其范围仅限于您选择的当前数据集。

数据图表区域下方的预览也为您提供了有用的数据上下文。

使用“数据”选项卡和“自定义”选项卡，您可以更改可视化类型、选择时间列、选择要分组的指标以及自定义图表的外观。

使用下拉菜单自定义图表时，请确保单击“运行”按钮以获得视觉反馈。

在下面的屏幕截图中，我们可以创建一个按时间分组的条形图，只需单击下拉菜单中的选项，按产品系列可视化季度数据。

创建切片和仪表板

要保存图表，首先单击保存按钮。您可以:

保存图表并将其添加到现有仪表板中。

保存图表并将其添加到新仪表板中。

在下面的截图中，我们将图表保存到新的“超集Duper仪表板”中:

要发布，请单击保存并转到仪表板。

在后台，超集将创建一个切片，并在其紧凑的数据层中存储创建图表所需的一切(查询、图表类型、所选选项、名称等)。).

要调整图表大小，首先单击右上角的铅笔按钮。

，单击并拖动图表的右下角，直到图表布局捕捉到您最喜欢的基础网格上的位置。

单击保存保存更改。

恭喜你！您已经成功地在超集中链接、分析和可视化了数据。还有许多其他表配置和可视化选项，因此请开始探索和创建您自己的切片和仪表板。

Apache Superset常见问题

1.我可以一次连接/查询多个表吗？

不在浏览或可视化用户界面中。超集SQLAlchemy数据源只能是单个表或视图。

使用表时，解决方案是创建一个包含分析所需的所有字段的表，可能是通过一些计划的批处理。

视图是一个简单的逻辑层，它将任何SQL查询视为一个虚拟表。这允许您连接多个表，并使用任意的SQL表达式进行一些转换。数据库可能会受到限制，因为超集可以有效地在查询(视图)之上运行查询。一个好的做法可能是将自己限制为只将主大表连接到一个或多个小表，并尽可能避免使用GROUP BY，因为超集将自己执行GROUP BY，执行两次工作可能会减少能量。

无论是使用表还是视图，重要的因素是数据库能否以足够快的交互速度提供服务，从而在Superset中提供良好的用户体验。

2.我的数据源有多大？

可能会很大！超集充当基础数据库或数据引擎之上的薄层。

如上所述，主要标准是数据库能否在用户可接受的时间范围内执行查询并返回结果。许多分布式数据库可以执行交互式扫描万亿字节的查询。

3.如何向仪表板添加动态过滤器？

使用过滤器框小部件构建切片并将其添加到仪表板。

使用过滤器框小部件，您可以定义一个查询来填充可用于过滤的下拉列表。为了构建不同值的列表，我们运行一个查询，根据您提供的指标对结果进行排序，并按降序对它们进行排序。

该小部件还有一个复选框周期过滤器，可以为仪表板启用时间过滤。选中此框并刷新后，您将看到一个从和到的下拉列表。

默认情况下，筛选器将应用于基于共享筛选器所基于的列名的数据源构建的所有切片。还需要在表编辑器的“列”选项卡中使列可过滤。

但是，如果您不希望一些小部件在仪表板上被过滤，该怎么办？您可以通过编辑仪表板来做到这一点。编辑表单中的打开元数据字段，更具体地说，是filter_immune_slices键。此字段将接收一个sliceIds数组，该数组不应受到任何仪表板级别筛选的影响。

在上面的json blob中，切片324、65和92不受任何仪表板级别过滤的影响。

现在记下filter_immune_slice_fields键。这允许您更具体地定义特定slice_id应该忽略哪些筛选器字段。

请注意，使用了关键字__time_range，它是为处理上述时间边界过滤而保留的。

但是，当处理来自不同表或数据库的切片时，过滤会发生什么？如果共享列名，将应用筛选器，就这么简单。

4.如何限制仪表板上的计划刷新？

默认情况下，仪表板定时刷新功能使您能够根据设置的时间表自动重新查询仪表板上的每个切片。但是，有时您不想刷新所有切片，尤其是当一些数据移动缓慢或运行大量查询时。要从计划的刷新过程中排除特定切片，请将定时刷新免疫切片键添加到仪表板打开元数据字段:

在上面的示例中，如果为仪表板设置了计划刷新，则除324以外的每个切片都将按计划自动重新查询。

切片的刷新也将在指定的时间段内交错进行。您可以通过将交错_刷新设置为false来关闭此交错，并通过在打开元数据字段中将交错_时间的值设置为毫秒来修改交错周期:

在这里，如果启用了定期刷新，整个仪表板将立即刷新。2.5秒的交错时间将被忽略。

为什么“烧瓶fab”或超集在启动时被冻结/启动/无响应(我的主目录有NFS)？

默认情况下，超集正在创建和使用SQLite数据库~/。如果SQLite用在NFS，众所周知，SQLite不能很好地工作，因为NFS的文件锁定实现被破坏了。

您可以使用超集_主环境变量覆盖此路径。

另一种解决方案是通过在以下位置添加以下内容来更改超集存储sqlite数据库超集_config.py的位置:

SQLALCHE _ DATABASE _ I = & # 8216SQLite:////new/location/super set . db & # 8217；

5.如果表模式改变了怎么办？

表格在不断发展，超集需要反映这一点。在仪表板的生命周期中，添加新的维度或指示器很常见。要让超集发现新列，只需转到菜单->:Source->；表中，单击架构已更改的表旁边的编辑图标，然后从详细信息选项卡中单击保存。幕后，新的栏目将被合并。稍后，您可能需要重新编辑该表以配置“列”选项卡，选中相应的框并再次保存。

6.我可以使用哪个数据库引擎作为超集的后端？

应该注意的是，数据库的后端是超集用来存储其内部的OLTP数据库，例如用户列表、切片和仪表板定义。

超集已经用Mysql、Postgresql和Sqlite作为后端进行了测试。建议您在这些数据库中的一个上安装超集以用于生产。

使用非列存储，如Vertica、Redshift或Presto等非OLTP数据库作为数据库后端根本无法工作，因为这些数据库不是为这类工作负载设计的。在Oracle、Micsoft SQL Server或其他OLTP数据库上的安装可能有效，但尚未经过测试。

请注意，几乎所有具有SqlAlchemy集成的数据库都可以作为Superset的数据源正常运行，而不是作为OLTP后端运行。

收起介绍展开介绍

更多 >> 生活实用APP精选一站式生活实用必备 APP 合集，覆盖健康管理、追番追剧、休闲娱乐、效率工具等日常刚需场景,汇集轻食、AI、智能助手、运动计步、美食推荐教学、微博、直播平台等优质应用，既能科学管理饮食身材、智能解答生活疑问，也能精准记录运动睡眠、随心寻觅美食好物，还能随时刷社交热点、看直播休闲放松。多款高口碑实用软件一站式收录，覆盖日常自律、饮食健康、社交娱乐全需求，帮你简化生活琐事、提升日常幸福感，解锁便捷高品质生活。