博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
data_summarize.pl data目录文本时长汇总脚本
阅读量:5227 次
发布时间:2019-06-14

本文共 1505 字,大约阅读时间需要 5 分钟。

#!/usr/bin/env perl

# Copyright 2018 Jarvan Wang

if (@ARGV != 1) {

#print STDERR "Usage: keyword_summarize.pl text utt2dur\n";

print STDERR "Usage: keyword_summarize.pl <data>\n";

exit(1);

}

my $text_file="$ARGV[0]/text";

my $utt2dur_file="$ARGV[0]/utt2dur";

unless(-e $text_file && -e $utt2dur_file )

{

print STDERR "$text_file or $utt2dur_file does not exist!";

exit(1);

}

my %text_hash;

my %dur_hash;

my %sumdur_hash;

my %count_hash;

# read text

open(TEXT,$text_file);

while(<TEXT>){

my $temp=$_;

chomp $temp;

@line=split(/ /,$temp,2);

$text_hash{$line[0]}=$line[1];

}

# read utt2dur

open(DUR,$utt2dur_file);

while(<DUR>){

my $temp=$_;

chomp $temp;

@line=split(/ /,$temp,2);

$dur_hash{$line[0]}=$line[1];

}

# summarize text duration

for my $key (keys %text_hash)

{

$sumdur_hash{$text_hash{$key}}+=$dur_hash{$key};

$count_hash{$text_hash{$key}}+=1;

}

#for my $key (sort keys %sumdur_hash) {

#printf("文本@语句数@@小时\n");

printf("文本@语句数@小时\n");

my $count_sum,$sec_sum,$hour_sum;

foreach my $key (sort { $sumdur_hash{$a} <=> $sumdur_hash{$b} or $a cmp $b } keys %sumdur_hash)

{

my $value=sprintf("%.2f",$sumdur_hash{$key});

$count_sum+=$count_hash{$key};

$sec_sum+=$value;

$hour_sum+=$value/3600;

if($value>1000)

{

#printf("%s@%d@%.2f@%.2f\n",$key,$count_hash{$key},$value,$value/3600);

printf("%s@%d@%.2f\n",$key,$count_hash{$key},$value/3600);

}

}

#printf("总和@%d@%.2f@%.2f\n",$count_sum,$sec_sum,$hour_sum);

printf("总和@%d@%.2f\n",$count_sum,$hour_sum);

 

转载于:https://www.cnblogs.com/JarvanWang/p/10280793.html

你可能感兴趣的文章
回文串---Palindrome
查看>>
三角形问题
查看>>
Centos7.x Docker桥接网络
查看>>
RedisLive监控工具 windows部署笔记
查看>>
[Codeforces 316E3]Summer Homework(线段树+斐波那契数列)
查看>>
搭建好LAMP架构,部署OwnCloud
查看>>
EasyUI-EasyUI框架入门学习
查看>>
django新建站点时的问题
查看>>
高性能网站优化——请求响应原理
查看>>
Spring3 + Spring MVC+ Mybatis 3+Mysql 项目整合
查看>>
Android 中的MVC MVP MVVM
查看>>
Oracle练习题(1~19)
查看>>
利用JAVA想数据库中提交数据
查看>>
WOJ 41 约数统计
查看>>
两次考试
查看>>
RabbitMQ学习在windows下安装配置
查看>>
Git安装和使用(谨记)
查看>>
javascript-观察者模式
查看>>
python中数字和字符串连接的两种方法
查看>>
Centos下安装Scrapy
查看>>