| 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172 |
- package sub_helper
- import (
- "fmt"
- "github.com/allanpk716/ChineseSubFinder/internal/pkg/my_util"
- "github.com/allanpk716/ChineseSubFinder/internal/pkg/vad"
- "math"
- "time"
- )
- type SubUnit struct {
- baseTime time.Time // 这个是基础的时间,后续需要减去这个,不然与导出的片段字幕去对比会有一个起始时间的偏差
- offsetStartTime time.Time // 相对时间,这个时间会减去 baseTime 再存储
- offsetEndTime time.Time // 相对时间,这个时间会减去 baseTime 再存储
- VADList []vad.VADInfo
- subCount int
- firstAdd bool
- outVADBytes []byte
- }
- func NewSubUnit() *SubUnit {
- return &SubUnit{
- VADList: make([]vad.VADInfo, 0),
- subCount: 0,
- firstAdd: false,
- outVADBytes: make([]byte, 0),
- }
- }
- // AddAndInsert 添加一句对白进来,并且填充中间的空白,间隔 10ms
- func (s *SubUnit) AddAndInsert(oneSubStartTime, oneSubEndTime time.Time) {
- /*
- 这里有个比较有意思的细节,字幕拆分到 dialogue 的时候,可能连续的多个 dialogue 是时间轴连续的
- 但是实际上的语言就是可以分为几个句子的
- 那么,在本函数中,就需要判断插入的时候,与上一句话的时间轴关系,前置无需进行句子的合并
- 如果两句话时间轴是连续的(差值为0),那么就要主动修改这一点,采取的方案可以是
- 1. 前后各 0.001 秒即可
- 2. 后面这一句向后 0.002 秒(暂时优先考虑这个,容易实现)
- */
- const perWindows = float64(vad.FrameDuration) / 1000
- // 不是第一次添加,那么就需要把两句对白中间间隔的 active == false 的插入,插入间隙
- if len(s.VADList) > 0 {
- nowStartTime := s.RealTimeToOffsetTime(oneSubStartTime)
- nowStartOffsetTime := my_util.Time2SecendNumber(nowStartTime)
- nowEndOffsetTime := s.GetEndTimeNumber(false)
- needAddRange := nowStartOffsetTime - nowEndOffsetTime
- if needAddRange == 0 {
- // 说明是连续的句子,向后加 0.002 秒
- addMore := time.Duration((s.GetEndTimeNumber(true) + 0.002) * math.Pow10(9))
- s.VADList = append(s.VADList, *vad.NewVADInfoBase(false, addMore))
- // 因为是连续的两句话的时间轴,强制插入了一个点,那么就需要在这句话的 Start 部分向后延迟对应的秒数
- oneSubStartTime = oneSubStartTime.Add(time.Duration(0.002 * math.Pow10(9)))
- } else {
- for i := 0.0; i < needAddRange; {
- s.VADList = append(s.VADList, *vad.NewVADInfoBase(false, time.Duration((s.GetEndTimeNumber(true)+i)*math.Pow10(9))))
- i += perWindows
- }
- }
- }
- if s.firstAdd == false {
- // 第一次 Add 需要给 baseTime 赋值
- s.baseTime = oneSubStartTime
- s.offsetStartTime = s.RealTimeToOffsetTime(oneSubStartTime)
- s.firstAdd = true
- }
- s.offsetEndTime = oneSubEndTime.Add(-my_util.Time2Duration(s.baseTime))
- nowStartTime := s.RealTimeToOffsetTime(oneSubStartTime)
- nowEndTime := s.RealTimeToOffsetTime(oneSubEndTime)
- nowStartOffsetTime := my_util.Time2SecendNumber(nowStartTime)
- nowEndOffsetTime := my_util.Time2SecendNumber(nowEndTime)
- needAddRange := nowEndOffsetTime - nowStartOffsetTime
- for i := 0.0; i < needAddRange; {
- s.VADList = append(s.VADList, *vad.NewVADInfoBase(true, time.Duration((my_util.Time2SecendNumber(oneSubStartTime)+i)*math.Pow10(9))))
- i += perWindows
- }
- s.subCount++
- }
- // GetDialogueCount 获取这个对白单元由几个对话
- func (s SubUnit) GetDialogueCount() int {
- return s.subCount
- }
- // GetVADSlice 获取 VAD 的 byte 数组信息
- func (s *SubUnit) GetVADSlice() []byte {
- if len(s.outVADBytes) != len(s.VADList) {
- s.outVADBytes = make([]byte, len(s.VADList))
- for i := 0; i < len(s.VADList); i++ {
- if s.VADList[i].Active == true {
- s.outVADBytes[i] = 1
- } else {
- s.outVADBytes[i] = 0
- }
- }
- }
- return s.outVADBytes
- }
- // GetStartTimeNumber 获取这个单元的起始时间,单位是秒
- func (s SubUnit) GetStartTimeNumber(realOrOffsetTime bool) float64 {
- return my_util.Time2SecendNumber(s.GetStartTime(realOrOffsetTime))
- }
- // GetStartTime 获取这个单元的起始时间
- func (s SubUnit) GetStartTime(realOrOffsetTime bool) time.Time {
- if realOrOffsetTime == true {
- return s.offsetStartTime.Add(my_util.Time2Duration(s.baseTime))
- } else {
- return s.offsetStartTime
- }
- }
- // GetEndTimeNumber 获取这个单元的结束时间,单位是秒
- func (s SubUnit) GetEndTimeNumber(realOrOffsetTime bool) float64 {
- return my_util.Time2SecendNumber(s.GetEndTime(realOrOffsetTime))
- }
- // GetEndTime 获取这个单元的起始时间
- func (s SubUnit) GetEndTime(realOrOffsetTime bool) time.Time {
- if realOrOffsetTime == true {
- return s.offsetEndTime.Add(my_util.Time2Duration(s.baseTime))
- } else {
- return s.offsetEndTime
- }
- }
- // GetTimelineRange 开始到结束的时间长度,单位是秒
- func (s SubUnit) GetTimelineRange() float64 {
- return s.GetEndTimeNumber(false) - s.GetStartTimeNumber(false)
- }
- // GetOffsetTimeNumber 偏移时间,单位是秒
- func (s SubUnit) GetOffsetTimeNumber() float64 {
- return my_util.Time2SecendNumber(s.baseTime)
- }
- // GetFFMPEGCutRange 这里会生成导出 FFMPEG 的参数字段,起始时间和结束的时间长度
- func (s SubUnit) GetFFMPEGCutRange(expandTimeRange float64) (string, string) {
- var tmpStartTime time.Time
- if s.GetStartTimeNumber(true)-expandTimeRange < 0 {
- tmpStartTime = time.Time{}
- } else {
- startTime := s.GetStartTime(true)
- subTime := time.Duration(expandTimeRange) * time.Second
- tmpStartTime = startTime.Add(-subTime)
- }
- return fmt.Sprintf("%d:%d:%d.%d", tmpStartTime.Hour(), tmpStartTime.Minute(), tmpStartTime.Second(), tmpStartTime.Nanosecond()/1000/1000),
- fmt.Sprintf("%f", s.GetTimelineRange()+expandTimeRange)
- }
- // RealTimeToOffsetTime 真实时间转偏移时间
- func (s SubUnit) RealTimeToOffsetTime(realTime time.Time) time.Time {
- dd := my_util.Time2Duration(s.baseTime)
- return realTime.Add(-dd)
- }
|