Tiểu sử Đặc điểm Phân tích

Mức độ dễ hiểu của giọng nói được tìm thấy là. Khả năng hiểu ngôn ngữ

KHẢ NĂNG HIỂU NGÔN NGỮ

Trong các phòng được thiết kế để nghe giọng nói, độ rõ của nó là quan trọng hàng đầu. Mức độ rõ ràng của giọng nói là tỷ lệ tương đối hoặc tỷ lệ phần trăm các thành phần giọng nói được người nghe tiếp nhận một cách chính xác trong tổng số các thành phần được nói. Các yếu tố của lời nói là âm tiết, âm thanh, từ, cụm từ. Theo đó, khả năng hiểu âm tiết, âm thanh, lời nói, ngữ nghĩa của lời nói được phân biệt.

Việc xác định khả năng hiểu của giọng nói được thực hiện bằng cách sử dụng các bảng phát âm đặc biệt được đọc bởi phát thanh viên trong phòng kiểm tra. Do đó, phương pháp nghiên cứu này được gọi là khớp nối. Các mẫu bảng khớp nối của các âm tiết được đưa ra trong Ứng dụng. IV (Bảng I, 2). Số lượng người nghe được xác định bởi kích thước của phòng. Thông thường, có ít nhất 20 thính giả tham gia nghiên cứu, phân bổ đều khắp phòng. Người nghe viết ra các yếu tố của bài phát biểu trên các biểu mẫu khi họ nghe thấy chúng. Sau đó, người nghe đổi chỗ và viết ra các bảng sau. Xử lý thống kê các kết quả thu được giúp bạn có thể đánh giá mức độ dễ hiểu của giọng nói ở nhiều nơi khác nhau trong phòng.

Trong các phòng có độ rõ âm tiết bằng hoặc lớn hơn 85%, độ rõ giọng nói được coi là xuất sắc. Khả năng hiểu giọng nói kém (khoảng 40% độ rõ âm tiết) tương ứng với khoảng 90% độ dễ hiểu của các cụm từ.

Một phương pháp cấp tốc để đánh giá khả năng hiểu của giọng nói đã được phát triển - phương pháp lựa chọn. Nó khác ở chỗ các từ giống nhau về âm được nhóm thành các bảng (xem Phụ lục IV, Bảng 3). Người thông báo chỉ đọc một từ trong mỗi nhóm các từ tương tự, và người nghe, có bảng, đánh dấu từ mà theo ý kiến ​​của họ, đã được đọc ra, sau đó xác định tỷ lệ phần trăm các từ nhận được đúng. Phương pháp này đòi hỏi ít đào tạo học viên hơn, nhưng kém chính xác hơn so với kỹ thuật khớp.

Độ rõ của giọng nói bị ảnh hưởng bởi các yếu tố sau: thời gian vang, âm lượng giọng nói, tỷ lệ tiếng ồn bên ngoài (bên trong phòng hoặc xâm nhập từ bên ngoài) và mức âm lượng giọng nói, cũng như hình dạng và kích thước của phòng. Có tính đến những yếu tố này, dựa trên phương pháp tính toán mức độ dễ hiểu của giọng nói do Knudsen đề xuất. Vì vậy, với thời gian âm vang khoảng 0,5 giây, độ rõ giọng nói là lớn nhất; khi thời gian âm vang tăng lên, độ rõ giọng nói giảm đi khoảng 10% trong mỗi giây thời gian.

Mức độ rõ ràng của giọng nói tốt nhất được quan sát ở mức giọng nói 70-80 dB. Nếu mức độ của giọng nói và tiếng ồn gây nhiễu gần giống nhau, độ rõ của giọng nói sẽ giảm xuống còn 60%.

Dựa trên những điều đã nói ở trên, thời gian âm vang T không thể tăng vô hạn, vì độ rõ của tín hiệu âm thanh bị suy giảm. Vì vậy, đối với các phòng, tùy theo nguồn âm mà nên đặt âm lượng tối đa theo Bảng. 2, và tùy thuộc vào âm lượng và thời gian vang này - mức độ rõ ràng tối đa của giọng nói (Hình 46).

Phương pháp Knudsen cho phép bạn đánh giá mức độ rõ ràng của giọng nói mà không cần thực hiện các bài kiểm tra phát âm, nghĩa là ở giai đoạn thiết kế.

Độ chính xác của phương pháp này không cao, và gần đây một số phương pháp tiên tiến hơn để tính mức độ dễ hiểu của giọng nói đã được đề xuất, các tác giả của chúng là Reichard, Nize và những người khác.

Độ rõ ràng và dễ hiểu của lời nói trong hội trường, cũng như chất lượng của âm thanh âm nhạc được cảm nhận, phụ thuộc vào cường độ của âm thanh trực tiếp và phản xạ âm thanh hữu ích đầu tiên. Đây là những phản xạ đến người nghe với độ trễ so với âm thanh trực tiếp, không quá 0,05 s đối với lời nói và 0,15 ¸ 0,20 s đối với âm nhạc. Năng lượng của phản xạ âm thanh ban đầu, giống như năng lượng của âm thanh trực tiếp, đề cập đến năng lượng âm thanh hữu ích. "Vô dụng" đề cập đến tất cả phần còn lại của năng lượng âm thanh, là nền âm vang trong phòng.

Cơm. 46. ​​Ảnh hưởng của thời gian vang T đến độ rõ của giọng nói P tùy thuộc vào âm lượng của căn phòng, m (theo Knudsen):

a - 707; b - 11300; trong - 45200

Hiệu quả kết quả của việc cảm nhận âm thanh trong phòng về mức độ rõ ràng của nó phụ thuộc vào độ lớn của hiệu ứng tương đối đối với người nghe của các phần hữu ích và "vô dụng" của năng lượng âm thanh. Tỷ lệ này được gọi là hệ số dễ hiểu, giá trị của nó được xác định theo công thức (15)

ở đâu - hấp thụ âm thanh ở 100% công suất phòng đối với tần số 500-2000 Hz;

α - hệ số hấp thụ âm thanh trung bình trong cùng điều kiện;

Đường đi của phản xạ đầu tiên từ nguồn âm đến điểm quan sát đến trong 0,05 (0,15¸0,20) s đầu tiên;

α 1, α 2, ... α n - hệ số hấp thụ âm thanh của các bề mặt mà từ đó có phản xạ hữu ích trực tiếp.

Tính dễ hiểu và dễ hiểu của giọng nói

Khả năng hiểu ngôn ngữ- đặc điểm chính xác định sự phù hợp của đường dẫn truyền lời nói. Việc xác định trực tiếp đặc tính này có thể được thực hiện bằng phương pháp thống kê liên quan đến một số lượng lớn người nghe và người nói. Định lượng độ rõ của giọng nói - sự dễ hiểu.

khả năng hiểu ngôn ngữ số tương đối hoặc số phần trăm của các phần tử giọng nói được nhận chính xác trong tổng số được truyền dọc theo đường dẫn được gọi. Các yếu tố của lời nói là âm thanh, từ, cụm từ, số phức tạp. Theo đó, họ phân biệt độ rõ âm tiết, âm thanh, lời nói, ngữ nghĩa và kỹ thuật số. Có một mối quan hệ thống kê giữa chúng. Trong thực tế, khả năng hiểu rõ về âm tiết, từ ngữ và ngữ nghĩa được sử dụng chủ yếu.

Để đo lường mức độ dễ hiểu, các bảng âm tiết đặc biệt đã được phát triển, có tính đến sự xuất hiện của chúng trong tiếng Nga. Các bảng này được gọi là nói rõ. Tính đủ điều kiện được đánh giá bằng cách sử dụng một nhóm thính giả được đào tạo không bị khiếm thính và khiếm thính bằng cách thực hiện các bài kiểm tra thống kê chủ quan. Trong trường hợp này, các phép đo có thể được thực hiện bằng nhiều phương pháp khác nhau, ví dụ, phương pháp cho điểm, phương pháp xác định tỷ lệ phần trăm các từ nhận được chính xác, v.v.

Mối quan hệ giữa mức độ dễ hiểu của giọng nói và mức độ dễ hiểu của nó được đưa ra trong Bảng. 16.1. Trong bảng này, mức độ dễ hiểu của giọng nói được đánh giá theo bốn cấp:

1) tuyệt vời, nếu khả năng hiểu rõ là đầy đủ, mà không cần đặt câu hỏi;

2) tốt, nếu người nghe có nhu cầu đặt câu hỏi lại riêng biệt về các từ hiếm hoặc tên riêng;

3) thỏa đáng, nếu người nghe báo cáo rằng họ khó hiểu, có những câu hỏi lặp đi lặp lại thường xuyên;

4) mức tối đa cho phép, nếu các cuộc thẩm vấn lặp đi lặp lại cùng một tài liệu được yêu cầu với việc truyền tải các từ riêng lẻ bằng chữ cái với thính lực căng thẳng.

Bảng 16.1

Các nguyên nhân làm giảm độ rõ là do tiếng ồn trong phòng, nhiễu từ âm vang và âm khuếch tán, không đủ khuếch đại tín hiệu của nguồn âm chính.

Hệ thống khuếch đại âm thanh và âm thanh phải cung cấp độ rõ cần thiết của giọng nói. Khi truyền tải các chương trình thông tin, tổ chức các cuộc mít tinh và các cuộc họp, cần phải có khả năng hiểu lời nói tuyệt vời, tức là khả năng hiểu rõ 80% âm tiết và 98% bằng lời nói. Đối với giao tiếp với người điều phối, khả năng hiểu giọng nói đầy đủ (mức độ hiểu đạt yêu cầu) đạt được với 40 ... 50% âm tiết và 87 ... 93% khả năng hiểu bằng lời nói. Do đó, khi tính toán thông tin liên lạc điều độ, chúng được hướng dẫn bởi các giá trị nhỏ hơn của mức độ dễ hiểu so với khi tính toán các hệ thống ứng dụng rộng rãi.

Có một mối quan hệ giữa khả năng hiểu lời nói, điều kiện tiếp nhận và đặc điểm của các đường dẫn truyền, được thiết lập bằng cách sử dụng lý thuyết định dạng do Fletcher và Collard phát triển.

Các vùng tập trung năng lượng trong một phần cụ thể của dải tần số được gọi là chất định hình. Vị trí của chúng phụ thuộc cả vào vị trí của âm thanh trong một từ hoặc cụm từ, và vào các đặc điểm riêng của bộ máy phát âm của con người. Mỗi âm thanh có một số công thức. Các hình thức của âm thanh giọng nói lấp đầy dải tần số từ 150 đến 7000 Hz.

Người ta đã thống nhất chia dải tần này thành 20 dải, trong đó xác suất xuất hiện của các chất định dạng là như nhau. Các dải tần số này được gọi là sọc có độ dễ đọc ngang nhau. Chúng đã được xác định cho một số ngôn ngữ, bao gồm cả tiếng Nga. Người ta đã xác định rằng xác suất xuất hiện kẻ thù tuân theo quy tắc cộng. Với một lượng vật liệu âm thanh đủ lớn, xác suất xuất hiện các chất tạo âm trong mỗi dải là 0,05.

Các chất định hình có các mức cường độ khác nhau: chúng ở âm thanh có giọng nói cao hơn so với âm thanh bị điếc. Khi mức độ tiếng ồn tăng lên, các công thức có mức độ thấp sẽ bị che đi trước tiên, sau đó mới đến các chất tạo thành cao hơn. Kết quả của việc che đậy, xác suất nhận biết formant giảm. Hệ số xác định sự sụt giảm này trong đến- dải thứ, được gọi là hệ số tri giác hoặc độ rõ ràng đến f. Nói cách khác, trong đến-xác suất nhận được định dạng không dải

hệ số cảm nhận formant ở đâu đến f phụ thuộc vào mức độ cảm giác, lần lượt được xác định bởi sự khác biệt giữa mức độ phổ trung bình của lời nói Trong r trong dải có độ rõ ràng ngang nhau và mức độ nhiễu và nhiễu phổ trong cùng một dải H w:

E f \ u003d V p -V sh.(16.2)

Hệ số cảm nhận (khả năng hiểu rõ) có thể được xác định từ biểu đồ thể hiện trong hình. 16.1. Biểu đồ này cho thấy các mức độ cảm giác E f và hệ số nhận thức tương ứng của chúng đến f.

Đối với mức độ cảm giác 0-18 dB đến f có thể được xác định gần đúng bằng công thức k f = (E + 6)/30.

Hình 16.1. Phân phối tích phân các mức giọng nói.

Nói chung, đối với mỗi dải có độ rõ như nhau, hệ số cảm nhận sẽ khác nhau. Mức độ rõ ràng về hình thức tổng thể trong dải tần số giọng nói được xác định từ

(16.3)

Hình 16.2. Sự phụ thuộc của độ hiểu âm tiết vào formant.

Mối quan hệ giữa công thức và các dạng hiểu rõ khác đã được tìm thấy bằng thực nghiệm. Sự phụ thuộc như vậy đối với tính dễ hiểu của âm tiết được thể hiện trong Hình. 16.2. Con số này cho thấy rằng khả năng hiểu gần như hoàn toàn của lời nói (độ rõ âm tiết là 80%) có được khi chỉ nhận được một nửa trong số tất cả các dạng (độ rõ dạng dạng là 0,5), điều này cho thấy sự dư thừa của lời nói và khả năng kết hợp của não bộ.

Việc xác định mức độ rõ ràng của giọng nói cho các phòng âm thanh chủ yếu được thực hiện đối với các điểm của bề mặt âm thanh có mức âm thanh trực tiếp tối thiểu và mức tiếng ồn âm thanh tối đa. Mức phổ của âm thanh trực tiếp từ một người nghe ở một điểm như vậy,

,(16.4)

ở đâu Trong rm- mức phổ của lời nói tại micrô (xác định từ bảng);

,

ở đâu r m - tháo micrô khỏi loa; - mức phổ của lời nói ở khoảng cách 1 m (xác định từ bảng tham chiếu); - chỉ số khuếch đại (chỉ số đường dẫn - sự khác biệt giữa các mức âm thanh được tạo ra bởi loa của hệ thống tăng cường âm thanh ở tai người nghe và nguồn âm thanh chính ở đầu vào micrô).

Những dữ liệu này được xác định cho từng dải có độ rõ ràng như nhau. Đối với các dải giống nhau, mức độ nhiễu và nhiễu quang phổ tại vị trí nghe

(16.5)

ở đâu Trong tro- mức phổ của tiếng ồn âm thanh (xác định từ các bảng tham chiếu); Trong p- mức độ nhiễu phổ từ lời nói (tự che dấu giọng nói),

(16.6)

Hiệu chỉnh nhiễu từ âm thanh khuếch tán ở đâu (R- tỷ lệ âm thanh tại điểm thiết kế); N d- hiệu chỉnh nhiễu xạ, hiệu chỉnh phản xạ từ đầu người nghe (xác định từ bảng tham chiếu); - hiệu chỉnh nhiễu âm vang (T p- Thời gian vang dội).

Mức độ tiếng ồn âm thanh không phụ thuộc vào chỉ số đường, trong khi mức độ nhiễu âm tăng lên khi tăng chỉ số đường (16,4), (16,6). Vì vậy, để tăng mức độ cảm giác, nên tăng chỉ số đường. Sau khi đạt được điều kiện

V p \ u003d Vash + 6 (16.7)

Chỉ số đường tăng hơn nữa là không hợp lý, vì mức độ cảm giác trong giới hạn có thể chỉ tăng 1 dB. Điều kiện này, có tính đến (16.4), (16.6), (16.7), xác định chỉ số đường dẫn

(16.8)

Chỉ mục đường dẫn này được gọi là hợp lý. Nó chủ yếu được xác định bởi giá trị lớn nhất của tỷ lệ âm thanh tại điểm được tính toán và thời gian âm vang.

Với sự khuếch đại hợp lý, nó theo sau từ (16.5)

H w \ u003d V p + 1, (16.9)

những thứ kia. đóng góp tiếng ồn âm thanh Trong tro mức độ nhiễu và nhiễu tổng thể là không đáng kể.

Các biểu thức kết quả cho phép bạn xác định mức độ dễ hiểu và dễ hiểu của lời nói. Để thực hiện điều này, theo công thức (16.4), (16.6), (16.9), mức độ tiếng nói, tiếng ồn và nhiễu được tìm thấy và sau đó, theo công thức (16.2), mức độ cảm giác của các chất định dạng được xác định. E f cho mỗi dải có mức độ dễ đọc như nhau. Sự phụ thuộc đồ họa được trình bày trong hình. 16.1, cho phép bạn tìm các hệ số về mức độ dễ hiểu đến f, tương ứng với các giá trị nhận được E f. Mức độ hiểu rõ về formant chung NHƯNG trong dải tần số giọng nói được tìm thấy từ biểu thức (16.3), và mức độ hiểu âm tiết tương ứng được xác định từ hình. 16.2. Mức độ dễ hiểu của lời nói được xác định bởi bảng. 16.1.

Đặc điểm âm học của lời nói

Tín hiệu tiếng nói là một quá trình tạp âm được điều chế theo tần số và biên độ phức tạp được đặc trưng bởi các thông số sau: áp suất âm thanh, dải tần số, mức tín hiệu tiếng nói, dải động.

Áp suất âm thanh - áp suất bổ sung xuất hiện trong môi trường trong quá trình truyền sóng âm. Truyền trong một môi trường, sóng âm thanh tạo thành các ngưng tụ và các hiện tượng hiếm, tạo ra những thay đổi bổ sung về áp suất so với giá trị trung bình của nó. Áp suất âm thanh là đặc tính định lượng chính của âm thanh. Mức áp suất âm thanh - giá trị của áp suất âm thanh được đo trên thang tương đối, quy về áp suất tham chiếu p0 = 20 µPa, tương ứng với ngưỡng nghe của sóng âm hình sin có tần số 1 kHz:

Dải động - tỷ số giữa giá trị lớn nhất của công suất tín hiệu tức thời Pmax với giá trị nhỏ nhất của công suất tức thời Pmin, hoặc theo đơn vị logarit:

Trong biểu thức này, giá trị của Pmax được coi là giá trị của công suất tín hiệu, giá trị này chỉ có thể vượt quá trong 2% tổng thời gian truyền và giá trị của Pmin được coi là giá trị của công suất tín hiệu. , phải vượt quá 98% tổng thời gian. Dải động của tín hiệu truyền chương trình phát âm thanh:

Bài phát biểu của người nói - 25..35 dB;

Đọc nghệ thuật - 40..50dB;

Thanh nhạc và nhạc cụ - 45..55dB;

Dàn nhạc giao hưởng - lên đến 65dB.

Phổ năng lượng của tín hiệu tiếng nói là dải tần mà năng lượng chính của tín hiệu được tập trung (Hình 2.2). Từ hình vẽ, lời nói là một quá trình băng thông rộng, phổ tần số của nó trải dài từ 50..100 Hz đến 8000..10000 Hz. Tuy nhiên, nó đã được thiết lập rằng chất lượng âm thanh khá hài lòng khi phổ được giới hạn ở tần số 300..3400 Hz. Các tần số này được coi là ranh giới của phổ giọng nói hiệu quả. Với dải tần được chỉ định, độ rõ âm tiết là khoảng 90%, độ rõ các cụm từ hơn 99% và độ tự nhiên thỏa đáng của âm thanh được duy trì.


Hình 2.2 - Thành phần phổ của lời nói.

Tham số quan trọng nhất đặc trưng cho phổ (phân bố năng lượng hoặc biên độ trên các tần số) của tín hiệu lời nói là các công thức (Hình 2.3), được định nghĩa là nồng độ năng lượng trong một vùng tần số giới hạn. Chất định dạng được đặc trưng bởi tần số, độ rộng và biên độ. Tần số của chất định dạng được coi là tần số của biên độ lớn nhất trong chất định dạng. Nói cách khác, chất định dạng là một cụm biên độ nào đó trên đồ thị phổ và tần số của nó là tần số đỉnh của cụm này.


Hình 2.3 - Các hình thức của lời nói.

Mức độ dễ hiểu của giọng nói và các phương pháp đo lường nó

độ rõ âm thanh âm thanh giọng nói

Tính đủ điều kiện là tỷ lệ giữa số phần tử giọng nói được nhận đúng với tổng số phần tử được truyền đi. Vì âm thanh, âm tiết, từ và cụm từ được coi là yếu tố tương ứng nên khả năng hiểu của âm thanh, âm tiết, lời nói, ngữ âm, ngữ nghĩa và hình thức được phân biệt. Tất cả chúng, khi thử nghiệm cùng một hệ thống, sẽ được biểu thị bằng các giá trị số khác nhau, vì tỷ lệ ước tính đúng cho một thông báo được dự đoán trước luôn cao hơn so với một thông báo không lường trước được - mức độ nhìn thấy trước khi nghe một cụm từ cao hơn khi nghe các từ riêng lẻ.

Tính đủ điều kiện được đo lường với sự trợ giúp của một nhóm thính giả được đào tạo đặc biệt bằng cách thực hiện các bài kiểm tra thống kê khách quan.

Bảng 2.1 cho thấy mối quan hệ giữa mức độ dễ hiểu và mức độ dễ hiểu.

Bảng 2.1

Sự dễ hiểu của lời nói là một đặc điểm ngữ âm của sự dễ hiểu và được xác định trong quá trình đàm phán của những người nghe chưa qua đào tạo.

Lớp rõ ràng:

Tuyệt vời - hoàn toàn rõ ràng mà không cần đặt câu hỏi;

Tốt - cần có những câu hỏi lại riêng biệt về các từ hoặc tên hiếm;

Đạt yêu cầu - rất khó để nói chuyện, câu hỏi lặp đi lặp lại là cần thiết;

Mức tối đa cho phép - yêu cầu nhiều câu hỏi lại của cùng một tài liệu với việc chuyển các từ riêng lẻ qua từng chữ cái khi nghe hết sức căng thẳng.

Vì vậy, phù hợp với GOST 50840-95, sự hiểu biết về giọng nói được truyền qua kênh giao tiếp với sự tập trung cao độ, các câu hỏi lặp đi lặp lại và lặp đi lặp lại được quan sát với mức độ hiểu âm tiết dưới 25-40%, trong trường hợp mức độ hiểu âm tiết ít hơn 25%, không đọc được văn bản mạch lạc (phân tích giao tiếp). Xem xét mối quan hệ giữa mức độ dễ hiểu bằng lời và âm tiết, có thể tính toán rằng sự cố trong giao tiếp sẽ được quan sát thấy khi mức độ hiểu bằng lời nói dưới 71%.

Nhiệm vụ đánh giá kênh rò rỉ thông tin giọng nói và do đó, mức độ bảo mật của kênh được giảm chính xác xuống đo lường hoặc tính toán mức độ rõ ràng của giọng nói và so sánh giá trị với giá trị được yêu cầu. Bản thân việc bảo vệ thông tin bao gồm việc giảm mức độ dễ hiểu của lời nói trong kênh rò rỉ thông tin bằng cách làm suy yếu mức tín hiệu hữu ích.

phương pháp khớp nối. Phương pháp này dựa trên việc đánh giá mức độ đáp ứng yêu cầu chính - đảm bảo tính dễ hiểu của lời nói được truyền đi. Phép đo mức độ dễ hiểu là một giá trị được xác định bằng tỷ lệ giữa số lượng thành phần giọng nói được nhận đúng với tổng số lượng đủ lớn các thành phần được truyền đi và được biểu thị dưới dạng phần trăm hoặc phần nhỏ của một đơn vị - độ rõ ràng của giọng nói. Phương pháp xác định các đại lượng này được gọi là phương pháp khớp.

Các phép đo tính rõ ràng được thực hiện bởi các nhóm được đào tạo và lựa chọn đặc biệt. Các bài kiểm tra bao gồm truyền một loạt các bảng bao gồm các yếu tố rõ ràng của lời nói, ghi lại những gì đã nghe và tính toán tỷ lệ phần trăm trung bình của các yếu tố nhận được chính xác. Tùy thuộc vào bảng phát âm được sử dụng (âm tiết, lời nói, cụm từ), các loại mức độ hiểu sau được đo lường:

độ rõ ràng của âm thanh - D;

độ dễ hiểu của âm tiết - S;

tính dễ đọc của từ - W;

độ dễ hiểu của các cụm từ - J.

Vào cuối chu kỳ truyền và nhận, các bảng nhận và truyền được so sánh và tính toán tỷ lệ phần tử nhận đúng.

Đối với một khối lượng phép đo đủ lớn, tức là khi tỷ lệ phần trăm mức độ hiểu được tính trên một số lượng lớn các âm tiết nhận được (có thứ tự từ vài trăm trở lên), ảnh hưởng của các yếu tố ngẫu nhiên khác nhau và các đặc điểm chủ quan của từng người vận hành được tính trung bình và các phép đo khớp cho kết quả ổn định, khách quan và lặp lại . Các giá trị rõ ràng thu được từ các phép đo như vậy là một ước tính về chất lượng của đường dẫn được thử nghiệm. Ước tính này đặc trưng cho con đường đã thử nghiệm (trong trường hợp của chúng tôi là vùng trời của một phòng chuyên dụng + cấu trúc tòa nhà). Do không có ý nghĩa ngữ nghĩa trong các âm tiết được truyền tải, ảnh hưởng của nhiều yếu tố chủ quan bị loại bỏ phần lớn.

Người ta đã xác định rằng đối với mỗi ngôn ngữ quốc gia, tất cả các dạng dễ hiểu: âm - D, âm tiết - S, động từ - W và cụm từ - J được kết nối với nhau bằng các phụ thuộc hàm rõ ràng có dạng S = f (D), W = f (S), J = f (W), không thay đổi đối với bất kỳ điều kiện truyền nào trên đường đời thực. Từ thực tế là có sự phụ thuộc rõ ràng đối với các loại độ rõ ràng như D, S, W, J, có thể được đo trực tiếp bằng cách sử dụng bảng khớp, chúng ta có thể kết luận như sau: các phép đo với các loại bảng khác nhau hoàn toàn không bổ sung cho nhau , nhưng chỉ đơn giản là tương đương với nhau (theo nghĩa là thông tin về chất lượng của đường dẫn có thể nhận được từ kết quả của các phép đo này). Điều này có nghĩa là không cần thiết phải đo lường tất cả các loại độ rõ ràng. Chỉ cần đo một trong những đại lượng này là đủ, và phần còn lại có thể lấy từ các tỷ lệ hoặc đồ thị tương ứng. Do đó, thích hợp nhất là phép đo kiểu hiểu rõ, trong trường hợp cụ thể này là kinh tế nhất, i. với độ chính xác đo lường như nhau, nó đòi hỏi chi phí tối thiểu về công sức, tiền bạc và thời gian cho việc sản xuất của chúng. Tuy nhiên, khi thực hiện các bài kiểm tra về khả năng phát âm, việc sử dụng khả năng hiểu âm tiết và lời nói sẽ được ưu tiên hơn, bởi vì. cung cấp ít phụ thuộc hơn của kết quả thử nghiệm vào các đặc điểm chủ quan của bộ khớp nối (ví dụ, chẳng hạn như khả năng ghi nhớ).

Các nghiên cứu thực nghiệm ở trên đã chỉ ra các mối quan hệ sau đây giữa các loại khả năng hiểu của giọng nói tiếng Nga và tiếng Anh:


Hình 2.4a - Sự phụ thuộc của độ dễ hiểu của các âm tiết vào độ dễ hiểu của các công thức.


Hình 2.4b - Sự phụ thuộc của độ rõ âm tiết vào độ dễ hiểu của âm thanh.


Hình 2.4c - Sự phụ thuộc của độ dễ hiểu của từ vào độ dễ hiểu của âm thanh.


Hình 2.4d - Sự phụ thuộc của độ dễ hiểu của các cụm từ vào độ dễ hiểu của âm tiết.


Hình 2.4e - Sự phụ thuộc của mức độ dễ hiểu của các cụm từ vào mức độ dễ hiểu của từ.

Ưu điểm của phương pháp phát âm, dẫn đến ứng dụng rộng rãi trong thực tế, là phương pháp này đưa ra đánh giá định lượng khách quan về chất lượng truyền lời nói theo đặc điểm chính của nó - tính dễ hiểu, và việc đánh giá này có thể được thực hiện với mức độ khá cao. về độ chính xác.

Do đó, giá trị giới hạn của mức độ dễ hiểu về hình thức, mà tại đó có thể hiểu được ý nghĩa của một thông điệp bằng giọng nói, là 15%, tương ứng với 25% mức độ hiểu của từ. Nhiệm vụ ước tính kênh rò rỉ được giảm xuống việc đo lường hoặc tính toán mức độ rõ ràng của giọng nói trong kênh được phân tích và so sánh giá trị thu được với giá trị được yêu cầu.

Tất cả các phương pháp để đo độ rõ ràng của giọng nói được chia theo điều kiện thành chủ quankhách quan. “Có điều kiện” - vì có ít nhất hai cách hiểu về “tính chủ quan-khách quan” của phương pháp.

Diễn giải đầu tiên. Theo cách hiểu thứ nhất, với phương pháp chủ quan, mức độ hiểu của giọng nói được đánh giá dựa trên kết quả của một thí nghiệm duy nhất - do đó ảnh hưởng không thể tránh khỏi đến kết quả đo các đặc điểm của giọng nói và thính giác của những người tham gia thử nghiệm. Đến đối tượng hóa phương pháp này, bạn cần thực hiện nhiều thử nghiệm với nhiều người nói và người đăng ký, sau đó tính trung bình các kết quả đo.

Mức độ rõ ràng của giọng nói được truyền đi được đánh giá trên thang điểm năm của Ủy ban Cố vấn Quốc tế về Truyền thông Vô tuyến (CCIR):

· Không đọc được;

· Đôi khi dễ đọc;

dễ đọc với khó khăn;

dễ đọc;

khá rõ ràng.

Một ví dụ về việc đối tượng hóa các phép đo mức độ hiểu của giọng nói là các phương pháp hiện đại để đánh giá chất lượng truyền giọng nói qua các đường truyền thông, được nêu trong Tiêu chuẩn Nhà nước của Liên bang Nga, theo đó ít nhất 3 người nói và 4-5 người đánh giá phải tham gia. các bài kiểm tra, đáp ứng một số điều kiện (không có khiếm khuyết phát âm giọng nói và thính giác, thiếu đào tạo). Ví dụ: khi đánh giá mức độ hiểu của cụm từ, người nói đọc một bảng cụm từ với tốc độ phát âm bình thường (một cụm từ trong 2,4 giây) và bảng thứ hai với tốc độ nhanh (một cụm từ trong 1,5-1,6 giây). Khoảng dừng giữa các cụm từ nên là 5-6 giây. Đánh giá viên trước tiên lắng nghe bảng do người nói đọc với tốc độ bình thường, sau đó bảng được đọc bởi người nói đó với tốc độ nhanh hơn. Tính đúng đắn của việc tiếp nhận các cụm từ được xác định bởi việc nhận được truyền qua kênh điện thoại. Chu kỳ đo bao gồm việc truyền tải bởi tất cả người phát biểu của 10 bảng mỗi bảng và được tất cả người đánh giá của tất cả các bảng được truyền tải chấp nhận. Một cụm từ được coi là nhận sai nếu ít nhất một từ được nhận sai, bỏ qua hoặc thêm vào. Mức độ hiểu của cụm từ được xác định bằng cách tính toán tỷ lệ phần trăm các cụm từ nhận được chính xác cho tỷ lệ phát âm bình thường và tăng tốc theo công thức

trong đó j i - kết quả của một phép đo duy nhất về mức độ dễ hiểu của cụm từ,%; N là số lần đo đơn lẻ; J H - độ hiểu cụm từ ở tốc độ phát âm bình thường,%; J Y - khả năng hiểu ngữ âm ở tốc độ phát âm nhanh,%.

Các phương thức như mô tả ở trên được gọi là nói rõ. Khi sử dụng chúng, cần phải có các bảng khớp nối đặc biệt, việc biên soạn chúng là một nhiệm vụ khó khăn độc lập. Một nhược điểm khác của các phương pháp ghép nối là thời gian thử nghiệm dài, khoảng vài tuần.

Ưu điểm rõ ràng của các phương pháp khớp nối là tính đơn giản của chúng, cho phép người vận hành có trình độ kỹ thuật tương đối thấp có thể tham gia thử nghiệm.

Diễn giải thứ hai. Trong cách giải thích thứ hai về “tính chủ quan-khách quan” của phương pháp, tất cả các phương pháp được gọi là chủ quan, trong đó con người là một bộ phận cấu thành của đường đo, và phương pháp khách quan là những phương pháp trong đó toàn bộ quá trình đo được thực hiện bằng dụng cụ. mà không có sự tham gia của các giác quan của con người. Vì vậy, các toán tử truyền và nhận phải được thay thế bằng các thiết bị tương đương nhân tạo ("giọng nói nhân tạo", "tai nhân tạo").

phương pháp giọng điệu. Bài báo này mô tả hai phương pháp để đo độ rõ ràng của giọng nói dựa trên cách giải thích tính khách quan này. Trong cái gọi là "phương pháp âm" một số người thông báo được thay thế bằng một giọng nói nhân tạo duy nhất tạo ra âm thanh thuần túy. Giọng nói nhân tạo là một loa bình thường không có hình nón, được kích thích bởi một bộ tạo âm theo cách sao cho mức áp suất âm thanh được tạo ra ở các tần số khác nhau sẽ tương ứng với đường cong phổ định dạng. Phòng truyền và phòng tiếp nhận tín hiệu tiếng nói bị nhiễu giả tạo - do đó cung cấp tỷ lệ tín hiệu trên nhiễu cần thiết, tại đó hệ thống được kiểm tra sẽ hoạt động bình thường. Việc tiếp nhận thông tin vẫn được thực hiện bởi một nhóm kiểm toán viên. Trong đó nhiệm vụ của kiểm toán viên được đơn giản hóa: thay vì hiểu và ghi lại tổ hợp âm thanh mà họ nghe được, họ chỉ được yêu cầu xác định xem tín hiệu có được nghe ở một tần số nhất định hay không. Ngoài ra, người vận hành phải đo cảm giác của các chất định dạng - điều này được thực hiện khá đơn giản bằng cách đưa sự suy giảm tích cực hoặc tiêu cực vào đường truyền thông. Nếu một tín hiệu được nghe thấy, sự suy giảm được thực hiện tích cực cho đến khi tín hiệu không còn nghe được nữa. Ngược lại, nếu tín hiệu không được nghe thấy, sự suy giảm được thực hiện âm cho đến khi tín hiệu trở nên nghe được. Việc xác định thêm giá trị của khả năng hiểu giọng nói được thực hiện theo phương pháp phân tích, sử dụng đồ thị và công thức đơn giản.

Do đó, phương pháp âm sắc, trái ngược với phương pháp khớp nối, có thể được quy cho phương pháp gián tiếp các phép đo tính dễ đọc.

Ưu điểm của phương pháp âm sắc:

1) bảng khớp nối không được sử dụng;

2) giảm đáng kể thời gian đo.

Nhược điểm của phương pháp âm sắc:

1) yêu cầu gia tăng về trình độ kỹ thuật của nhân viên tổ chức các bài kiểm tra;

2) người đó vẫn chưa được rút khỏi hệ thống đo.

Như đã chỉ ra trong, phương pháp âm sắc được quy định bởi GOST số 8031-56. Đến giờ, có lẽ, GOST này đã được thay thế bằng một GOST cao cấp hơn.

phương pháp khách quan. Trong một phương pháp khác được gọi là "khách quan" sử dụng cả giọng nói nhân tạo và tai nhân tạo. Trong phương pháp này, như chúng ta thấy, người đó hoàn toàn bị loại bỏ khỏi hệ thống đo lường. Cần lưu ý rằng tai nhân tạo là một thiết bị phổ biến trong kỹ thuật đo âm thanh, được sử dụng trong thử nghiệm điện thoại và cho phép bạn tái tạo tải âm thanh do tai tự nhiên tạo ra trên điện thoại. Do đó, có thể đo áp suất âm thanh do điện thoại phát ra trong tai.

Thứ tự chung của các phép đo trong trường hợp này như sau:

1) Với sự trợ giúp của bộ tạo tiếng ồn và loa, mức tiếng ồn được tạo ra tương ứng với các điều kiện hoạt động của đầu thu sóng được thử nghiệm. Đo mức ồn ở đầu ra của tai nhân tạo trong dải tần số quan trọng của thính giác và tần số trung bình của dải này bằng tần số của âm đo.

2) Bộ tạo tiếng ồn bị tắt và thay vào đó, tín hiệu âm được đưa đến đầu vào của đường dẫn "giọng nói nhân tạo - kênh truyền - tai nhân tạo". Mức cường độ âm thanh tại micrô được lấy sao cho ở mức không có điều kiện trên bộ điều khiển suy giảm, phân bố áp suất âm thanh tương ứng với đường cong phổ định dạng.

3) Bằng cách điều chỉnh độ suy giảm, mức tín hiệu ở đầu ra của tai nhân tạo giống với mức của tiếng ồn. Các chỉ số của bộ điều khiển giảm chấn là kết quả của việc đo lường mức độ cảm giác.

Phương pháp mục tiêu chính xác hơn và nhanh hơn so với phương pháp trọng âm, nó không yêu cầu người vận hành (người thông báo và người đánh giá). Cuối cùng, phương pháp mục tiêu về cơ bản có thể tự động hóa hoàn toàn quy trình đo trên cơ sở máy tính hiện đại.

Giống như phương pháp trọng âm, phương pháp mục tiêu là gián tiếp, tức là Mức độ rõ ràng của giọng nói được đánh giá không phải bằng cách đếm các đơn vị giọng nói được nhận dạng chính xác, mà bằng cách thực hiện một thử nghiệm đo lường đặc biệt với các tín hiệu âm thanh ở dạng âm sắc và tiếng ồn dải tần, trong đó mức độ cảm giác trong một số dải tần số được đo. Độ rõ của giọng nói được tính toán dựa trên kết quả của các phép đo thực nghiệm.

Với những ưu điểm không thể phủ nhận của phương pháp khách quan, cũng như do những điểm tương đồng cơ bản giữa TPR và TKUI đã nêu ở trên, hiện nay, phương pháp khách quan trong một sửa đổi hay cách khác được sử dụng cả trong đánh giá chất lượng của các kênh truyền thông và đánh giá hiệu quả của việc bảo vệ thông tin lời nói. Do đó, bạn nên xem xét chi tiết ý tưởng làm cơ sở cho các phương pháp gián tiếp được thảo luận ở trên để đo mức độ hiểu của giọng nói. Đồng thời, cũng nên nhắc lại một số quy định về tâm sinh lý của lời nói và thính giác, về việc sử dụng các phương pháp gián tiếp nào.


Thông tin tương tự.


Độ rõ giọng nói là gì

Ngày nay, trên thế giới có hơn 500.000.000 người bị khiếm thính. Đó là lý do tại sao vấn đề về máy trợ thính là rất phổ biến.

Nghe âm thanh và nghe giọng nói là hai khái niệm hoàn toàn khác nhau, mặc dù chúng có những đặc điểm vật lý giống nhau ( phổ tần số, mức áp suất âm thanh). Khi nói về sự giảm mức độ hoạt động thính giác của con người, một số tiêu chí nhất định được ngụ ý, một trong số đó là mức độ dễ hiểu của lời nói của con người. Do đó, cần phải có máy trợ thính để khuếch đại tín hiệu âm thanh chất lượng cao, cũng như cải thiện độ rõ của giọng nói của con người.

Khả năng hiểu lời nói là một tập hợp hoạt động liên tục của các cơ quan tai, dây thần kinh thính giác và trung tâm thính giác trong vỏ não. Sự thất bại của ít nhất một trong những thành phần này dẫn đến những thay đổi về khả năng hiểu của giọng nói. Nếu không tập trung vào não, có thể cho rằng máy trợ thính được lựa chọn và điều chỉnh đúng cách sẽ bù đắp cho việc mất thính lực về mặt chất lượng.

Khoa học giải quyết các vấn đề về thính giác đã xác định rằng trong không gian của các tần số dao động âm thanh, lời nói của con người có một phổ đặc biệt. Sau khi nghiên cứu, cái gọi là " cao nhất về mức độ dễ hiểu của giọng nói". Nhờ dữ liệu như vậy, có thể phân biệt giọng nói của con người với âm thanh nền, do đó cải thiện chất lượng độ rõ tổng thể. Máy trợ thính chủ yếu là công cụ hỗ trợ giao tiếp với mọi người.

Cải thiện độ rõ của giọng nói

Có một quan niệm sai lầm phổ biến rằng việc tạo ra máy trợ thính chỉ giới hạn trong một giải pháp khá đơn giản - micrô, bộ khuếch đại và loa. Điều gì có thể dễ dàng hơn? Mục đích của việc sản xuất các mô hình máy tính phức tạp có giá khoảng mười, thậm chí hàng trăm nghìn rúp là gì? Vì vậy, có những người như vậy cung cấp cho họ và người thân của họ những sản phẩm, có thể nói là của riêng họ hoặc " tự làm»Sản xuất, tất nhiên, gây ra thiệt hại không thể khắc phục được và tổn hại đến thính giác của người khiếm thính. Vì lý do tương tự, không nên mua máy trợ thính ở bên hoặc " từ bàn tay”, Nhưng chỉ ở các trung tâm y tế chuyên khoa.

Ở nước ta, bạn có thể tìm thấy những chiếc máy trợ thính được bày bán từ các hãng khác nhau, từ loại rất rẻ đến loại đẹp, đắt tiền. Máy trợ thính của công ty widex»Đây là những thiết bị nguyên bản, tiện lợi, chất lượng cao và dễ sử dụng. Nhờ những cải tiến mới nhất trong xử lý tín hiệu kỹ thuật số và điện tử, máy trợ thính ngày nay " widex»Rất nhỏ để chúng vừa vặn thoải mái trong ống tai.

Trợ thính " widex»Có khả năng thay đổi phạm vi khả năng hiểu giọng nói của con người. Tính năng này có sẵn cho tất cả các loại máy trợ thính. widex»: Cả cho máy trợ thính sau tai và máy trợ thính trong tai và trong tai.

Vấn đề về khả năng nghe của các bộ phận giả và tăng độ rõ ràng của giọng nói của một người cần được giải quyết dưới sự giám sát chặt chẽ của các chuyên gia (nhà thính học) tại các trung tâm chuyên biệt, nơi các đặc điểm cá nhân của một người được xem xét và quan trọng nhất là mong muốn của một người để lấy lại thính giác đã mất. .