소개 AI 음성 에이전트의 정의 AI 음성 에이전트는 자연어 처리(NLP) 및 음성 인식 기술을 사용하여 작업을 수행하고 질문에 답하며 정보를 제공하는 인공 지능(AI) 기반 소프트웨어 프로그램입니다. 가상 비서 또는 음성 활성화 AI라고도 합니다. 인공지능 음성대리인의 인기 상승 개요 AI 음성 에이전트는 삶을 더 쉽게 만들고 효율성을 높이며 편리함을 제공하는 능력으로 인해 점점 더 대중화되고 있습니다. 스마트폰, 스마트 스피커, 노트북 등 다양한 기기에 통합되어 사용자가 쉽게 접근할 수 있습니다. 블로그 게시물의 목적 이 블로그 게시물의 목적은 AI 음성 에이전트의 역사, 작동 방식, 응용 프로그램 및 사용, 이점, 과제 및 제한 사항, 향후 전망을 포함하여 AI 음성 에이전트에 대한 포괄적인 개요를..

Ubuntu 서버에 Anaconda 설치한다. Anaconda 에 가상환경을 추가한다. CUDA, cuDNN 버전에 맞는 Tensorflow GPU 를 설치한다. 1. Anaconda setup Anaconda 3 최신버전 다운: https://www.anaconda.com/products/individual 다운 된 파일실행 : Anaconda3-2022.10-Linux-x86_64.sh sh Anaconda3-2022.10-Linux-x86_64.sh Anaconda 설치시 yes 했음. 설치 완료 done installation finished. Do you wish the installer to initialize Anaconda3 by running conda init? [yes|no] [no]..

PC 스펙은 다음과 같다. 2015년 즈음(?) 조립 PC 로 구매했던 것으로 기억한다. 내 PC 기준으로 Nvidia driver, CUDA, cuDNN 설치한 내용을 정리한다. PC 사양 CPU: Intel(R) Core(TM) i3-6100 CPU @ 3.70GHz 그래픽 카드: GeForce GTX 750 Ti SSD: Samsung SSD 750 (120GB) HDD: Seagate ST1000DM003-1ER1 (1TB) Memory: Samsung M378A1G43EB1-CPB (8GiB) 1. Nvidia driver 설치 nvidia 드라이버 설치 확인 $ cat /proc/driver/nvidia/version cat: /proc/driver/nvidia/version: No such ..

Carnegie Mellon University 의 William Chan 과 Google Brain 팀에서 2015년 8월 출간한 논문이다. Abstract Listen, Attend and Spell(LAS)는 음성 발화를문자로 표기해주는 신경망 모델을 소개한다. 전통적인 DNN-HMM모델과 달리, 모든 음성인식 과정을 End-to-End로 학습한다. 시스템은 크게 2개의 구성요소로 되어있다. 하나는 Encoder Part의 Listener이고, 다른 하나는 Decoder Part의 Speller이다. Listener는 피라미드 모양의 RNN 구조로 되어있고, 입력값으로 filter bank 를 통과한 spectrum들을 입력값으로 사용된다. Speller는 Attention 기반 RNN이고, Li..