이 뉴스 릴리스 (제품 가격, 제품 사양, 서비스 세부 정보, 출시일, 연락처 정보, URL 등)의 정보는 공지 날짜입니다. 정보는 통지없이 변경 될 수 있으며 검색 날짜와 다를 수 있습니다. 최신 문의는 다음과 같이 문의하십시오.문의 : 토토사이트 추천를 참조하십시오.
2007 년 4 월 20 일
이웃이 동시에 말하는 소리를들을 수 있습니다
발달 된 음성 처리 실시간 해와 토토사이트
콜 시스템에서 소음 제거 및 음성 인식 정확도 향상에 기여
토토 사이트. Central Research Institute (Director : Hitachi라고 불리는 Fukunaga Yasushi / Hightinafter)는 최근 이웃 사람들이 동시에 말하는 목소리를 누가 말한 사람을 명확하게 알 수있는 음성 처리 실시간 해와 토토사이트을 개발했습니다. 이 실시간 해와 토토사이트은 여러 마이크 (이하 마이크라고 함)를 사용하여 사운드 생성 위치 (사운드 소스 위치)와 특정 방향에서 사운드 만 추출 할 수있는 실시간 해와 토토사이트을 즉시 측정하는 실시간 해와 토토사이트의 개발을 통해 실현되었습니다. 이 실시간 해와 토토사이트을 사용하면 마이크에서 1-2 미터 떨어진 여러 사람과 오디오를 구별하고 주변 소음을 제거하고 특정 오디오 만 추출 할 수 있습니다. 이를 통해 비디오 컨퍼런스 및 컨퍼런스 콜에서 외부 노이즈를 제거하고 시끄러운 환경에서 음성 인식의 정확도를 향상시킬 수 있으며 여러 마이크가있는 비디오 장면에서 특정 사람의 오디오 만 추출 할 수 있습니다.
비디오 컨퍼런스 및 컨퍼런스 통화 용 통화 장치 및 음성 인식 기능을 사용하여 작업을 수행하는 자동차 탐색, 사용되는 환경의 소음 및 동시에 음성을 동시에 발화시키는 경우 통화 성능 및 장치 작동 가능성을 손상시킬 수 있습니다. 이전에는 오디오 처리 실시간 해와 토토사이트이 에어컨, 프로젝터 등에서 끊임없이 방출되는 노이즈를 제거하는 데 사용되었지만이 방법은 여러 사람이 갑자기 발생하는 노이즈를 동시에 사용할 수 없었습니다. 갑작스런 노이즈를 제거하는 한 가지 실시간 해와 토토사이트은 소리가 미리 생성되는 장소의 방향을 설정하고 노이즈로 다른 방향에서 노이즈를 제거하는 것입니다. 그러나이 방법은 사운드 주파수로 인해 정확도가 제한되어 있으므로 사운드 소스가 서로 가까울 때 사운드 소스를 구별하는 것은 불가능했습니다.*. 또한이 방법은 사운드의 각 주파수에 대한 사운드 소스 위치가 필요했기 때문에 몇 초 동안 사운드를 입력하는 데 시간이 필요했습니다.
이러한 이유로 음성을 사용하여 시스템의 성능을 향상시키기 위해서는 여러 사람의 특정 사람의 음성을 동시에 추출하고 갑작스런 소음을 제거 할 수있는 오디오 처리 실시간 해와 토토사이트을 개발해야했습니다.
이 문제를 충족시키기 위해 토토사이트 는 소리가 높은 순간에 높은 정확도로 사운드 생성 위치를 측정하는 사운드 처리 실시간 해와 토토사이트을 개발했으며 특정 방향에서 사운드를 즉시 선택하고 제거합니다. 개발 된 실시간 해와 토토사이트의 특징은 다음과 같습니다.
1. "근접 사운드 소스 현지화 기술"은 즉각적인 정확도로 사운드 소스 위치를 측정 할 수 있습니다
기존의 사운드 소스 추정 실시간 해와 토토사이트과 비교할 때, 우리는 근접한 사운드 소스의 위치를 추정하기 위해 성능이 향상되었습니다. 여러 간격으로 여러 마이크 요소를 배열하고 다른 간격의 마이크 쌍으로 측정 된 데이터를 결합함으로써 사운드 소스의 위치를 추정하는 데 높은 정확도를 달성하고 사운드의 모든 주파수 구성 요소를 사용하여 처리함으로써 짧은 시간 내에 측정을 수행 할 수 있습니다.
2. "공간 오디오 필터링 기술"은 갑작스런 소음을 선택적으로 제거하기위한
사운드 소스 위치의 위에서 언급 한 추정 결과에서 소음 영역 내에 사운드 소스가 존재하면 해당 방향으로 사운드에 대한 사각 지점을 물리적으로 생성합니다. 이것은 노이즈 영역 내에서 생성 된 오디오를 억제합니다.
우리는 이번에 실험을 통해 개발 된 근접 사운드 소스 현지화 실시간 해와 토토사이트의 성능을 확인했으며, 사운드 소스가 수평 및 수직으로 마이크에서 약 1 ~ 2 미터 떨어진 곳에있을 때 전형적인 사무실 환경에서 10도에서 사운드 소스 위치를 결정하고 측정 할 수있었습니다. 또한, 두 사람이 수평 방향으로 20도 간격으로 동시에 발언하면 개인의 음성 내용 만 추출 할 수 있음이 확인되었습니다. 이 실시간 해와 토토사이트은 비디오 컨퍼런스 및 컨퍼런스 콜의 대화 환경 개선, 시끄러운 환경에서 음성 인식의 정확성을 향상 시키며 여러 마이크로 폰과 함께 기록 된 비디오 장면에서 특정 사람들 만 추출하고 사용하도록 허용하는 등 정보 장치에서 오디오 사용 확장에 기여합니다.
또한 이번에 개발 된이 실시간 해와 토토사이트은 2007 년 4 월 15 일부터 하와이 호놀룰루에서 개최 될 2007 년 음향, 연설 및 신호 처리 (ICASSP2007)에서 발표되었습니다.
- * 이것은 음원의 위치를 식별하기 위해 여러 마이크 요소에 도달하는 오디오의 시차를 사용하는 실시간 해와 토토사이트입니다. 일반적으로, 마이크 요소 사이의 거리가 더 넓을수록 사운드 소스 방향의 추정 성능이 높아지지만, 간격이 최대 음원 주파수의 절반보다 큰 경우 공간 별칭이라는 현상이 불분명하여 사운드 소스 방향을 추정하기가 어렵습니다. 이러한 이유로, 마이크 요소의 간격은 음원의 파장의 절반보다 클 수 없으며, 이는 음원 방향의 추정 성능을 제한했다.
연락처 정보
토토 사이트. Central Research Institute 계획 사무소 [담당 : Kinoshita, Hanawa]
1-280 Higashi-Keigakubo, Kokubunji City, 도쿄 185-8601
전화 : 042-327-7777 (Direct)
위
PDF 파일을 보려면 Adobe Systems Incorporated를 클릭하십시오.Adobe (R) Reader (TM)| 필요합니다.