딥러닝/기타 리뷰7 [음성데이터] 음성데이터 개괄2 [참고자료] https://www.youtube.com/watch?v=Pw9BUgCf6a8&t=2044s https://drive.google.com/drive/folders/1VPjvaF8KTTufxyC_5pstWiuwXCgyM2eC [목차] - 음성 스피커의 작동 원리(서버/디바이스) - streaming(on device) vs server - 스트리밍으로 음성 인식 - 더 나은 음성 인식을 위해서 : 디코딩 - wav2vec - 음성 데이터에서 conv 활용 - 또다른 흐름 @음성 스피커의 작동 원리(서버/디바이스) 딥러닝을 한 번이라도 해본 사람이라면 다 아는거겠지만, 이쪽의 문제는 컴퓨팅 리소스가 굉장히 중요하다는 점이다. 그래서 인공지능 스피커도 마찬가지로실생활에 쓸 수 있는 성능을 내기 위.. 2022. 7. 18. [음성데이터] 음성데이터 개괄 [참고자료] https://www.youtube.com/watch?v=MghbHLuupoA https://ratsgo.github.io/speechbook/docs/neuralam/ctc https://lynnshin.tistory.com/42 논문 4개는 너무 벅차서.. 본 포스팅은 영상과 리뷰 포스팅 위주로 흘러갑니다 [음성 데이터 활용 분야] 음성 데이터 분석은 어떤 분야에 활용할 수 있는가? 음성인식STT/ASR, 음성합성TTS, 음성비서, 스마트 스피커 등 [음성 데이터의 구조] - Waveform(음성 파일) 음성 데이터는 보통 waveform으로 저장된다. 소리를 어떤 주기로 쪼개서 그 세기를 기록한 것 하지만 이 waveform을 분석하지는 않고, 푸리에 변환을 거쳐서 spectrogram.. 2022. 7. 11. [Optimizer]AdamW "Decoupled Weight Decay Regularization" [혜림의 말로 요약하기] Adam은 일반화 성능이 안 좋다. SGD에서는 weight decay와 L2 정규화가 (수식에서) 똑같은 의미를 갖는 반면에, Adam 에서는 다르기 때문이다. Adam에서는 L2 정규화의 효과가 weight decay에 비해서 떨어진다. 따라서 weight decay를 Adam 과 함께 이용하기 위해 고안한 것이 AdamW 이다. weight decay를 더하는 식을 가중치 업데이트 식에 별도로 넣어줌으로써, weight decay와 learning rate 하이퍼 파라미터가 정규화에 주는 영향을 decouple 한 방법이다. 1. Introduction Adam 이 좋은 optimizer로 알려져 있지만.. 2022. 2. 10. [의료데이터] 단백질 구조 예측 [참고자료] https://www.youtube.com/watch?v=1YHsSFWn5OA&t=4319s https://www.youtube.com/watch?v=MHb18hhKQsY [이미지 출처] 더보기 Figure 1 : https://ko.wikipedia.org/wiki/%EB%8B%A8%EB%B0%B1%EC%A7%88_%EC%A0%91%ED%9E%98 Figure 2, 3 : https://www.youtube.com/watch?v=MHb18hhKQsY&t=86s Figure 4 : https://en.wikipedia.org/wiki/Multiple_sequence_alignment Figure 5,6,7,8 : https://www.youtube.com/watch?v=MHb18hhKQsY .. 2021. 11. 24. 이전 1 2 다음