본문 바로가기

전체 글83

[음성데이터] 음성데이터 개괄2 [참고자료] https://www.youtube.com/watch?v=Pw9BUgCf6a8&t=2044s https://drive.google.com/drive/folders/1VPjvaF8KTTufxyC_5pstWiuwXCgyM2eC [목차] - 음성 스피커의 작동 원리(서버/디바이스) - streaming(on device) vs server - 스트리밍으로 음성 인식 - 더 나은 음성 인식을 위해서 : 디코딩 - wav2vec - 음성 데이터에서 conv 활용 - 또다른 흐름 @음성 스피커의 작동 원리(서버/디바이스) 딥러닝을 한 번이라도 해본 사람이라면 다 아는거겠지만, 이쪽의 문제는 컴퓨팅 리소스가 굉장히 중요하다는 점이다. 그래서 인공지능 스피커도 마찬가지로실생활에 쓸 수 있는 성능을 내기 위.. 2022. 7. 18.

[음성데이터] 음성데이터 개괄 [참고자료] https://www.youtube.com/watch?v=MghbHLuupoA https://ratsgo.github.io/speechbook/docs/neuralam/ctc https://lynnshin.tistory.com/42 논문 4개는 너무 벅차서.. 본 포스팅은 영상과 리뷰 포스팅 위주로 흘러갑니다 [음성 데이터 활용 분야] 음성 데이터 분석은 어떤 분야에 활용할 수 있는가? 음성인식STT/ASR, 음성합성TTS, 음성비서, 스마트 스피커 등 [음성 데이터의 구조] - Waveform(음성 파일) 음성 데이터는 보통 waveform으로 저장된다. 소리를 어떤 주기로 쪼개서 그 세기를 기록한 것 하지만 이 waveform을 분석하지는 않고, 푸리에 변환을 거쳐서 spectrogram.. 2022. 7. 11.

[Classification] ResNet 요약 순서상 훨씬 전에 읽었어야 했지만 이제서야 읽고 올리는 ResNet 다. 마찬가지로 제목에서부터 요약이라고 하고 있기 때문에, 이번 포스팅에서는 말 그대로 핵심만 짚는다. [논문] https://arxiv.org/pdf/1512.03385.pdf Deep Residual Learning for Image Recognition ResNet은 "과연 모델의 깊이는 성능을 담보할 수 있는가?" 라는 질문에서 시작한다. 위 그림에서 볼 수 있듯이, 레이어를 많이 쌓은(56) 모델이 더 얕은 모델(20)보다 훈련 데이터 셋의 에러가 컸다. 그럼 이게 오버피팅인가? 오버피팅은 training error는 줄어듦에도 불구하고 test error 가 줄어드는 것을 의미하기 때문에, 올바른 설명이 아니다. 그렇다면 왜 .. 2022. 7. 10.

[softeer] GBC [문제] https://softeer.ai/practice/info.do?idx=1&eid=584 Softeer 연습문제를 담을 Set을 선택해주세요. 취소 확인 softeer.ai [생각거리] - 뭘 기준점으로 둘 것인가? [코드] import sys setting = list(map(int,input().split())) n, m = setting[0], setting[1] rule_meter = [] rule_speed = [] mock_meter = [] mock_speed = [] max_diff = 0 for i in range(n): value = list(map(int,input().split())) rule_meter.append(value[0]) rule_speed.append(valu.. 2022. 6. 27.

이전 1 2 3 4 5 6 ··· 21 다음

티스토리툴바