- 软件介绍
- 相关专题
- 下载地址
LABB-CAT简介
LABB-CAT提供语言学研究功能,可以多种语言分析你的评论,支持语料库管理功能。在trans CPT的上传过程中,LaBB-CAT会找到trans CPT中指定的参与者。如果找不到匹配的参与者记录,它将创建一个新的记录,支持更改语料库。每集都属于一个“文集”。如果选择了错误的语料库,可以使用菜单上的系列管理器选项。LaBB-CAT包括uniyn层管理器,用于摄取uniyn特定重音字典,并执行包含的脚本来生成所需种类的字典。生成的文件可以添加到LaBB-CAT中,层管理器可以配置成使用这个文件来标记带有音标的单词。它支持带有Unisyn字典的音标,带有纯文本文件的音标和带有西班牙语语音转录器的音标。它有很多语言分析功能!
LABB-CAT基本介绍
LaBB-CAT是一个基于浏览器的语言研究工具,用于存储音频或记录、文本抄本和其他笔记。
可以自动生成或手动添加各种类型的注释。
您可以在transcpts和注释中搜索特定的文本或正则表达式。您可以查看或保存各种格式的搜索结果或整个transcpts,也可以通过Web浏览器直接在声学分析软件中播放或打开录音的相关部分。
LABB-CAT软件功能
和媒体传输的存储。
LaBB-CAT本质上是一个按时间记录的音频/录音抄本的存储库。您可以使用Transcber、Praat或ELAN(可用于创建将抄本文本与音频/录音中的相应位置对齐的文档)来生成时间对齐的抄本。将trans CPT上传到LaBB-CAT,LaBB-CAT可以存储关于扬声器和trans CPT的其他信息。
灵感任务
你也可以定义启发任务,包括参与者的阅读技巧和他们想要回答的问题。
当参与者(使用他们的浏览器或移动设备)执行任务时,他们的声音将被记录并自动直接上传到LaBB-CAT:
自动注释
结合信号数据、原始正字法抄本和一些第三方数据和工具,笔记本可以自动标注,例如:
词汇标记
有了CELEX数据,可以用更多的数据自动注释单词:
语音学
音节化
形态学
单词
频率
其他字典也可以整合,包括U的发音字典和Unisyn字典。
强制对齐
使用HTK或WebMAUS,在话语级别对齐的转录本可以强制对齐单词和句子级别:
统计层
LaBB-CAT数据库本身的词频数据可以直接计算并标注在每个单词上:
语言查询和字数统计(LIWC)可用于比较语料库和参考语料库:
结合来自CELEX的时间校准和音节计数,可以在不同的域中计算语音速率:
脚本
您可以使用Python或Javascpt编写脚本来执行树计算和注释任务:
IBM沃森的个性化观点
LaBB-CAT可以与IBM Watson的个性洞察网络服务集成,对成绩单进行分析:
LABB-CAT软件特色
1.音标
根据您的语音数据,有几种方法可以获得单词的音素转录:
2.词汇标记
CELEX-使用英国英语、德语和荷兰语的CELEX层管理器之一。
U发音字典-对于英语,使用U发音字典层管理器。
Unisyn-使用Unisyn层管理器,适用于各种英语语言。
定义自己的字典,并使用平面文件字典层管理器将其集成到LaBB-CAT中。
3.从拼写推断发音
西班牙语,使用西班牙语语音转录器层管理器
基本网络服务:G2P-使用多种语言。
使用字符映射器图层管理器定义您自己的从拼写到语音的简单映射规则。
4.CELEX音标
如果您可以访问CELEX数据库,LaBB-CAT可以与之集成,这样就可以用来自CELEX的数据对成绩单上的单词进行注释,这些数据可以包括:
标准音素的转录-如“差异”→“dfrns”或“dfrns”
形式——如“差”→“差+差”
可能的句法类别-如“差异”→“n”
频率数据
引理
音节数
5.手动注释
例如,可以手动添加注释
主题标签
单个单词的文本标签
您可以使用Praat来注释时间点或时间间隔:
LABB-CAT安装方法
1.打开install-lab bcat-personal _ 20210216 . jar进入安装界面,点击开始。
2.提示开始将软件安装到计算机上,并等待安装结束。
LABB-CAT教程
转录指南
录音转写工具很多,LaBB-CAT支持最常用工具使用的转写文件格式。这些工具中的每一个都有自己的功能,用于指定发言者和元数据以及添加评论。
除了用于转录的特定工具和文件格式之外,还有一些通用原则可以促进LaBB-CAT中语音数据的后续处理。
拼写
许多自动注释任务涉及查找标准词典,未注释的单词不会被注释,因此尽可能使用标准拼写非常重要。
使用常规拼写。如果你不知道如何拼写,请在字典或地图上查找。
用空格而不是连字符完全写出所有数字,例如
使用缩写时,如果每个字母单独说,请在每个字母之间使用大写字母;否则,请使用不带空格的大写字母,例如
所有的单词都应该拼写完整,比如“and”和“假设”。即使是说话者所说的,最后的g s和d s-也不应该从单词中删除-例如
即使音节之间有停顿,也要始终把单个单词拼成一个完整的单词。
不要组织演讲。保留重复、填充和错误。
定义一组短词和缩写是可能的,只要它们使用一致——例如,如果你使用cos作为原因的简化版本,因为,请始终将其拼写为cos,它将永远不会导致or & # 8217Cse,也不是表亲。示例:
不满意的
与填充暂停的拼写保持一致非常重要:
建议使用后三个字母的拼写,因为这三个字母的拼写是m- m-可以匹配字典中字母M的名称,所以发音可以标记为/εm/,如果它的拼写有-mm的两个m-这有时是匹配单词的备选拼写mm,则可以标记为/& # 8217;mɪ-lɪ-"みtə/ .
不完整的停顿可以用连字符(用空格括起来)转录;一些模块使用这种暂停来帮助自动注释(例如,使用这种暂停的注释强制对齐HTK优势)-例如
不完整的单词应在单词末尾用颚化符标记(而不是连字符,可以解释为暂停),例如:
对于短暂的犹豫-然而,一些发音模块可以推断这些单词的发音,而无需手动发音标签。
文本和其他现场评论
一些转录工具允许为单个单词使用额外的标签,而另一些则不允许。例如,对于这些,用发音标记单词的唯一方法是使用转录约定。
如果您使用ELAN抄本、Praat文本文件或纯文本文件作为抄本,LaBB-CAT可选地支持以下抄写约定:
发明单词的发音或犹豫可以在使用该单词后立即用方括号标记出来(也就是说,单词和注释之间没有空格)——例如
stut〜[stVt]
犹豫的标准形式(或其他拼写不规范的单词)的完整形式可以通过在单词后使用括号(即单词和注释之间没有空格)来标记,例如
stut〜[stVt](stutter)
您可以使用方括号将噪声标记为空白,例如,用空格将方括号括起来
现在[舌尖咔嚓]
您可以使用大括号中的空格来添加注释,例如,
我突然想到这里(指着寺庙)
话语/台词
有些过程,如强制对齐,涉及处理记录中的单个发音,这些发音对应于许多转录系统中的文本行。长词或短词可能很难处理。
理想情况下,成绩单上的每一行应该有5到15个单词长,在有演讲停顿的地方应该有换行符。
有些标注工具允许你标注同时讲话的时间段,也就是多个人同时讲话的时间段。这些时间段应该尽可能精确地对齐,因为一些自动处理(例如,强制对齐)会忽略同时发生的语音。短时间同时发声确保尽可能少的声音被忽略。
强制对齐
强制对齐是自动处理发音记录及其正字法记录,以确定每个单词的开始和结束时间以及单词中的电话。
LaBB-CAT可以通过三种主要方式实现强制对齐:
1.带BAS网络服务的网络MAUS
2.佩恩对准器预训练声学模型的高温超导
3.通过训练自己的声学模型进行校准(“训练和校准”),实现HTK
对准精度
作为无人值守的自动过程,对齐并不总是最佳的。各种因素会降低比较的质量:
数据不足(如果您使用的是培训和校准方法)
录制质量差、背景噪音等。
语音同步(默认忽略)
不正确的成绩单
话语对齐不正确
成绩单上没有停顿标记。
字典和发音之间的语音不匹配,
例如,使用流变词典来对齐非流变语音。
因此,您应该手动并可能至少更正一些数据。
/正确对齐
您可以通过两种方式校正对齐方式/:
1.LaBB-CAT与Praat的集成
2.LaBB-CAT与动车组-webApp的集成
反向对齐
数据强制对齐后,手机中的开始/结束时间将在单词范围内,例如,这为分析和进一步注释提供了许多可能性。
1.使用Praat批处理目标令牌。
2.音节重构
楼宇自动化系统网络服务管理器和网络监控系统
在巴伐利亚语音信号(BAS)中,我们很高兴地宣布了一套语音处理网络服务,包括一个用于强制安排的网络MAUS。您可以通过使用网络浏览器直接使用该服务,但是LaBB-CAT也有一个名为BAS Services Mar的自动使用模块
一般流程如下图所示:
注意:使用WebMAUS进行强制校准需要LaBB-CAT通过互联网将您的录音和成绩单发送给第三方。尽管BAS Web服务的服务条款第3点明确表示,上传的数据将在24小时后删除,但您只能在参与者同意的情况下使用该服务。
如果您的演讲使用以下任何一种语言,您可以使用WebMAUS强制对齐:
LaBB-CAT必须能够识别每个成绩单中使用的语言,因此您必须确保设置了语言。
在成绩单的“语言成绩单”类别中,或在语料库页面上(您可以在其中为每个语料库的所有成绩单定义语言)。
您可以通过以下方式在LaBB-CAT中设置可用的语言选项:转到成绩单页面,单击语言类别的选项按钮。该值必须是两个字母的ISO639-1代码和可选的两个字母的国家代码,例如en或en-NZ。
脚步
安装图层管理器:
1.在LaBB-CAT中,单击菜单上的“图层管理器”链接,该链接将为您提供已安装图层管理器的列表。
2.在页面底部,单击“选择文件”和“未安装的图层管理器列表”链接。
3.在列表中找到BAS网络服务管理器,然后单击其“安装”按钮。
4.单击使用条款链接并阅读条款。
5.关闭术语页面,返回LaBB-CAT。
6.为“接受使用条款”选项选择“真”。
7.单击安装。
您将看到关于图层管理器的页面,包括如何设置强制对齐的说明。
设置图层以触发强制对齐:
1.单击菜单上的“金属层选项”。
2.页面底部有一个空白表格,用于创建新图层。填写以下详细信息:
描述:校准时间
简介:MAUS
图层类型:文本
层管理器:BAS网络服务管理器
对齐:时间间隔
生成:始终
3.单击新建。
4.您将看到一个允许您配置图层的表格。请查看本页的在线帮助来指导您。主要选择是“音素”编码:默认选项,disc,这可能是最好的,因为使用这种音素编码可以确保该层与其他模块配合良好,并且易于搜索。但是,您可以选择amp,在这种情况下,图层类型的分段图层应该设置为text。
5.单击保存。
6.如果要强制语料库中的所有录音立即对齐,请点按“重新生成”。
使用Praat/来校正对齐
转录本强制比对后,可以使用Praat集成转录本页面直接从LaBB-CAT中进行比对和校正。
要对齐:
1.在LaBB-CAT中,打开一个成绩单页面。
2.检查HTK层和分段层。
您将看到哪些行被强制对齐,因为它们有一个HTK时间戳,并且填充了细分层。如果漏了一些行,很可能是因为有一个不认识的字,另一个说话的人同时在,或者可能是HTK根本无法对齐行(造成这种情况的原因有很多,包括训练数据不足、录音噪音大、抄写不准确等。).
交互式成绩单页面不显示单词或电话的对齐方式,但您可以看到
使用Praat对齐单词或电话。你可以直接从抄本页面打开Praat中的一个声音,但是首先,
必须建立LaBB-CAT/Praat集成;只需要执行一次:
3.在页面的右上角,播放控件上方,有一个Praat图标?-点击它。
4.请遵循出现的说明(这些说明会因您使用的网络浏览器而异)。
可能会问你是否允许。LaBB-CAT集成小程序?快跑。如果你检查?不要再出现了?选项,此消息不会在您每次打开成绩单时出现。
您可能需要许可浏览器扩展来安装它,并且您可能需要连接到互联网来下载扩展。
也可能会问你Praat安装在哪里。导航到Praat的安装位置,双击?。Praat.exe?文件(在某些系统上,这个文件可以简单地称为?普拉特?)。
Praat程序可以立即打开和关闭,因为LaBB-CAT测试它可以与Praat通信。
现在Praat集成已经建立,您应该能够
从现在开始,访问成绩单页面的Praat选项& # 8230;
5.单击对齐的行,并在菜单上选择“在Praat中打开文本网格”选项。
可能会问你要不要允许访问LaBB-CAT集成小程序?-如果是,请选中“不再显示此内容”,然后单击“允许”。
Praat应该会打开并向您展示这一行音频的声谱图。下面是一个包含单词和句子的TextGd。
6.如果您点按一个单词并按键,将播放该单词的音程。尝试各种各样的词语,看看你对HTK的准确性及其对齐的感受。
试着在成绩单上用不同的行来做这件事。
您将会看到对齐在某些情况下运行良好,但在其他情况下就不那么好了。
7.调整单词和电话的对齐方式,使其更加准确,点击“成绩单”页面(LaBB-CAT中)的“导入更改”按钮。
这些更改被标记为手动编辑,因此如果再次运行强制对齐,它将不会被新的不正确对齐覆盖。因此,你所做的改变实际上是改进,这很重要,因为HTK再也不会改变它们了。
有一些关于你可以改变什么的规则:
您不得添加或删除文字(如有必要,请更正成绩单以完成这项工作)。
所有的电话都必须用他们自己的语言。
第一个电话的开头应该与单词的开头对齐,最后一个电话的结尾应该与单词的结尾对齐。
您不应该更改发音本身的对齐方式(仅选择“Praat”选项中的“打开文本Gd including”。1度”)。
- 安卓合集
- 软件合集
- 浏览器
- 电脑管家
- 安卓游戏
软件排行榜
热门推荐
-
Laravel
v8.42.0 / 4.37M / 简体中文
-
织梦无忧助手
v1.1.2 / 9.31M / 简体中文
-
Speedretopo
v0.0.4 / 25.76K / 简体中文
-
华医题库
v1.1.9 / 796.75M / 简体中文
-
Midas Gen
v8.75 / 680.47M / 简体中文
-
Kiosk官方版
v21.1.15.80.0121 / 79.8 MB / 简体中文
-
图档清洁专家官方版
v1.4.0.221 / 257 MB / 简体中文
-
老虎证券官方最新版
v7.5.1.0 / 81.40MB / 简体中文
-
飒特红外报告分析工具
v1.0 / 177.31M / 简体中文
-
凯元工具
v3.9.9 / 21.5M / 简体中文
装机必备软件
-
word文档密码破解工具应用软件
-
冰点还原永久免费版系统软件
-
人生日历应用软件
-
一彩送货单管理系统应用软件
-
Process View系统软件
-
开心手机恢复大师其他类别
-
pdf文件阅读器应用软件
-
视频剪辑格式工厂应用软件
-
PhotoMetri应用软件
-
specinker应用软件
-
miwifi驱动驱动工具
-
海洋色音效助手影音软件
-
乐播投屏影音软件
-
seo外链助手网络软件
-
AES安全加密记事本安全相关





