Домой / Игры / Когда появилась siri. Что с погодой

Когда появилась siri. Что с погодой

В последнее время в нашу повседневную жизнь всё больше проникают голосовые помощники. Большинство пользователей iPhone и других продуктов компании Apple хорошо знакомы с одним из них – Siri, но мало кто понимает все перспективы виртуальных ассистентов и умеет пользоваться всеми их возможностями и функциями.

Что такое голосовой помощник

Представьте, с вами рядом всегда находится ваш преданный друг, который в любое время дня и ночи готов с вами поговорить, ответить на любой ваш вопрос и выполнить поручения. При этом он никогда не устает, у него не бывает плохого настроения, и он с каждым днем становится всё умнее и понимает вас всё лучше. Это и есть голосовые помощники, которые доступны для повседневного использования уже сегодня.

Голосовые помощники встроены в компьютеры, планшеты, телефоны, умные часы, умные колонки и даже в автомобили. Важно понимать, что взаимодействие с голосовым помощником осуществляется исключительно голосом, без использования рук, не нажимая ни на какие кнопки. Это принципиально новый способ взаимодействия человека и программы, который очень похож на общение между людьми.

  • Siri от компании Apple.
  • Google Ассистент компании Google.
  • Alexa от Amazon.
  • Алиса от компании Яндекс.

Мы уже писали ранее и , а в этой статье мы подробно расскажем о Сири.


Голосовой помощник Siri

Siri – это голосовой помощник, который первым стал поддерживать русский язык, и только потом появилась отечественная , вышедшая в конце 2017 года, а еще позже летом 2018 на русском заговорил . Сири довольно хорошо распознает русскую речь, даже если рядом играет музыка или присутствуют посторонние шумы.


Сири в iPhone SE

Siri не всегда принадлежала компании Apple. Изначально, это было отдельное приложение в App Store для iOS. В 2010 году Apple приобрела компанию Siri Inc. и их уникальную разработку. Вскоре после покупки, Apple встроила Сири в iPhone 4S, а затем и в последующие свои устройства. Тогда, в 2011 году, Siri стала первым продуктом на рынке персональных голосовых ассистентов.

Siri подстраивается под каждого пользователя индивидуально, изучает его предпочтения и начинает лучше понимать своего «хозяина». В первую очередь это заметно в улучшении распознавания вашего голоса после первых недель использования. Также есть возможность указать Siri, как следует обращаться к вам и называть имена ваших контактов из адресной книги, чтобы она лучше вас понимала. А когда Siri произносит имена неправильно, всегда можно её поправить, показать правильное ударение.

Siri доступна на iPhone, iPad, Mac, Apple Watch, Apple TV и , а также почти во всех современных автомобилях через функцию CarPlay. Способ запуска Siri и список доступных команд разнится в зависимости от устройства.


Как запустить Siri на iPhone, iPad и iPod touch

Запуск нажатием кнопки «Домой»

Siri доступна на всех iPhone, начиная с iPhone 4s, на операционной системе iOS 5 и выше. Для запуска Siri на iPhone (за исключением iPhone X), нужно нажать и удерживать центральную кнопку «Домой».

Чтобы запустить Сири на iPhone X необходимо нажать и удерживать боковую кнопку.

После звукового сигнала, можно произносить запрос. На некоторых устройствах следует дождаться появления Siri на экране, прежде чем давать команду.

Привет, Сири – Как включить Siri голосом

Siri можно запускать исключительно с помощью голоса, вообще без нажатия на кнопки. Нужно будет всего лишь сказать: «Привет, Siri». После звукового сигнала можно задавать вопрос или давать команду.

Для этого на устройстве должна быть активирована функция «Привет, Siri»: Настройки → Siri и поиск → Слушать «Привет, Siri».

На всех моделях iPhone, начиная с iPhone 6s, а также на iPad Pro эту функцию можно использовать в любой момент, сказав «Привет, Siri» так, чтобы это уловили микрофоны гаджета. На более ранних айфонах и айпадах функция «всегда слушает» работает только тогда, когда ваш гаджет подключен к зарядному устройству.

Как включить Сири в наушниках

Используя оригинальную гарнитуру Apple с кнопками дистанционного управления или совместимые Bluetooth-наушники, активировать Siri можно нажатием на центральную кнопку или кнопку вызова. После звукового сигнала можно делать запрос.

Используя беспроводную гарнитуру AirPods от Apple, для запуска Siri дважды прикоснитесь к внешней поверхности любого наушника.

Сири на компьютере Mac

Siri доступна на компьютерах Mac с macOS 10.12 Sierra и более новыми версиями операционной системы. Однако, на данный момент функционал голосового помощника на маке ограничен. Все, что здесь умеет Siri – звонить по FaceTime, писать сообщения, включать музыку, показывать прогноз погоды и помогать работать с файлами и папками.


Сири на маке

Стоит отметить, что работа с файлами на компьютере с помощью голосового ассистента действительно удобна. Сири может осуществлять быстрый поиск файлов, сортировать их по типу, дате или ключевому слову. Например, если сказать Сири: «Покажи мои фотографии за вчерашний день», то откроется папка с соответствующими медиафайлами.

Активировать Siri на Mac можно несколькими способами:

Вероятно, в следующих версиях macOS появится больше команд для Siri, включая команды для HomeKit. Это будет логичным продолжением интеграции голосового помощника от Apple в свои ноутбуки и настольные компьютеры.


Функции Сири

Персональный ассистент Siri умеет отвечать на вопросы, давать рекомендации и выполнять команды. Давайте рассмотрим некоторые из них.


Это лишь малая часть всего того, что умеет Siri. Ознакомиться с большим количеством команд можно в нашей статье о командах для Сири . Полный же список команд для голосового помощника в айфонах и умных колонках Хоум Под вы найдете в нашем справочном мобильном приложении, которое мы регулярно обновляем. Скачать приложение «Команды Siri» можно бесплатно. Установив его, вы всегда будете иметь под рукой самый актуальный список команд для голосового помощника.

В последнее время смартфоны стали все больше входить в нашу жизнь, становясь главным атрибутом. С портативными устройствами современное поколение проводит все свое время, работая, играя или учась. Благодаря телефону покупатели постоянно на связи не только в мобильной сети, но и социальных. Речь идет о «ВКонтакте», «Твиттере», «Фейсбуке» и так далее. Хочется отметить, что смартфоны - неотъемлемые помощники. Они позволяют правильно распределить свой день, поставить цели, достигнуть их. Также благодаря телефонам можно контролировать собственное поведение. Конечно же, не без помощи приложений.

Одним из известных инструментов «общения» со смартфоном является «Сири». В этой статье пойдет речь о том, как помощник работает, активируется и так далее, а также подробно поговорим о том, что такое Siri.

Технология Siri

Для начала нужно сказать, что технология, по которой работает Siri, была создана огромной группой разработчиков. Если доверять источникам в интернете, то еще 40 лет назад ученые трудились над созданием искусственного интеллекта. В итоге появилось то, что способно анализировать и реагировать на всю информацию, которая дается человеком. «Сири» - вопросно-ответная система. Это наработка, которая полностью построена именно на всех подобных достижениях ученых. Благодаря тому, что компания Apple вовремя решила использовать подобные технологии в качестве дополнения к продукции, началась эра искусственного интеллекта. За счет огромных стараний и трудов ученых теперь человек может пользоваться «Сири». О том, что это и как работает - далее.

Siri в «Айфоне»

С «Айфона 4S» и до шестого поколения включительно Siri была выведена в качестве отдельного приложения. При желании программу можно было удалить или, наоборот, загрузить в свое устройство. Главное условие - чтобы смартфон работал на операционной системе IOS. Запускалась утилита обычным нажатием на иконку. Сейчас «Сири» стала базовой программой. Даже если пользователь еще пока не знает, что существует специальный магазин с официальными приложениями для «Айфонов», сразу же после покупки он может начинать пользоваться данным искусственным интеллектом. Что такое Siri и как работает?

«Сири» получила принцип речевых запросов, из которых она выделяет для себя команды и выполняет их. Благодаря работе компании утилита способна распознавать большой языковой пакет. На данный момент «Сири» имеет 20 вариаций. На территории Российской Федерации программа доступна на русском языке. Также есть функция обработки голоса.

Функции Siri

Человек, который еще не работал с «Сири», конечно же, задумывается не только о том, что такое Siri, но и какие же функции приложение выполняет. Для чего оно нужно, как может помочь при «общении» с гаджетом. Ответ максимально банален и прост. Утилита должна корректно и правильно распознавать все команды пользователя. Реакция довольно быстрая, ошибки исключены. Это и есть основная функция утилиты. Если говорить о более конкретных задачах, то, по сути, «Сири» способна выполнять любую команду, которая подвластна самому смартфону. Можно обратиться к утилите, чтобы она позвонила или отправила сообщение, к примеру, и немного подождать, пока запрос будет выполнен. Можно также совершать обработку голоса приложения.

Особенности программы

Конечно же, технологий, которые идеально бы понимали голос человека и все что он говорит, пока нет. «Сири» является попыткой создать средство общения смартфона и потребителя. Однако и оно имеет свои недостатки. Именно поэтому следует точно знать все особенности программы и как ею пользоваться. Siri на «Андроид» установить нельзя, но есть аналоги.

Обязательно все запросы должны быть максимально понятными. К примеру, будут выполнены следующие команды: «Позвонить папе», «Открыть почту» и так далее. Все запросы должны быть сформированы точно и не в произвольной форме. Подобное разрешено лишь для английского языка, так как этот пакет распознается лучше всего. Не следует забывать о манере произношения и четкости. Все фразы должны быть сказаны максимально правильно и отчетливо. Именно от этих факторов зависит то, в какой степени будет понят запрос. Также следует учитывать, что если команда будет отдана в шумном месте, то, скорее всего, «Сири» ее не поймет.

Доступные языки

Довольно актуальный вопрос - какие языки доступны в программе. Их много: русский, английский, шведский, немецкий, многие азиатские и так далее. Что это дает? Если языковой пакет установлен в «Сири», значит на нем можно общаться и делать запросы. В любом случае программа будет понимать команды. Однако есть одна особенность. Не все перечисленные языки доступны в операционной системе, а значит, что и «Сири» не будет на них функционировать. Если iOS версии выше 8.3, то проблема подобная может не возникнуть, так как в эту модификацию программного обеспечения была добавлена половина описанных выше языков.

Как работать с Siri?

Еще один актуальный вопрос, который многих интересует. Как работать с «Сири»? Включить программу можно двумя способами. Если она предустановлена и идет сразу же при покупке, то делать ничего особо не нужно. Программа будет запускаться при длительном нажатии на кнопку «Дом». Если нет желания пользоваться помощником или не нравится, что клавиша отвечает за его включение, то в настройках опцию можно отключить.

Второй же вариант заключается в том, что «Сири» на телефоне не установлена. Тогда утилиту придется ставить самостоятельно. Для этого следует зайти в официальный магазин «яблока» и скачать нужную программу. После установки зайти в «Сири» можно прямо с рабочего стола. Она будет работать как обычное приложение. Активации или регистрации программа не требует. Эта разработка максимально понятна и проста. Интерфейс простой, понятный, любой человек сможет использовать такого помощника. Напомним, что Siri на «Андроид» не существует.

Как пользоваться?

Использовать «Сири» еще проще, чем скачивать ее самостоятельно. Следует зайти в приложение. Там пользователь заметит строку записи звука. Подобная панель имеется также в диктофоне. К тому же запуск программы оснащен звуковым сопровождением, после которого приятным голосом произносится фраза «Привет, я могу чем-то помочь?». Владелец аппарата говорит, что ему необходимо.

Примером такого запроса может служить фраза: "Сири, покажи мне рядом находящиеся бесплатные парковки". Как только речь будет записана, прозвучит еще один сигнал. После него «Сири» выдаст результаты выполнения команды на экран.

«Siri не слышит мой голос, что делать?»

Иногда бывает так, что «Сири» не распознает голос или не слышит его вообще. Если нет желания относить телефон в сервисный центр и платить деньги, то можно попробовать самостоятельно выяснить причину и разобраться с ее решением.

Сразу же стоит проверить работоспособность операционной системы. Очень часто после перепрошивки или обновления «Сири» не хочет слушать запросы владельца. Обычно лечится это при помощи жесткой перезагрузки, но, к сожалению, не в 100% случаев. Если не помогло, то следует зайти в настройки и попробовать «пошаманить» там: включить/выключить помощника, разрешить доступ к микрофону и так далее.

Еще одной распространенной проблемой можно назвать поломку микрофона. Чтобы проверить это, можно подключить гарнитуру. Если через нее помощник реагирует, то проблема, вероятно, в телефоне. При отсутствии наушников можно зайти в любую программу, где можно осуществить голосовой ввод. Опять-таки, если он не работает и в других утилитах, то проблема в микрофоне. В таком случае следует отнести свой телефон в сервисный центр. Там помогут решить проблему. Если смартфон еще на гарантии, то сделают это бесплатно.

Теперь любой человек сможет ответить на вопрос «Что такое Siri?». Программа понятная и удобная.

Siri - голосовой ассистент, который впервые был представлен в 2011 году вместе с iOS 5. Разумеется, с тех пор он серьезно развивался: научился говорить на разных языках (в том числе и на русском), пришел на компьютеры Mac, научился взаимодействовать с программами от сторонних разработчиков и т.д., но качественный скачок он сделал только с анонсом iOS 10 - теперь его голос основан на глубоком обучении, что позволяет ему звучать более естественно и плавно. Что такое глубокое обучение и как синтезируется голос Siri - об этом мы и поговорим в этой статье.

Введение

Синтез речи - искусственное воспроизведение человеческой речи - широко используется в различных областях, от голосовых помощников до игр. Недавно, в сочетании с распознаванием речи, синтез речи стал неотъемлемой частью виртуальных персональных помощников, таких как Сири.

Существуют две технологии синтеза речи, используемые в звуковой индустрии: выбор звуковых единиц и параметрический синтез. Синтез выбора единиц обеспечивает наивысшее качество при достаточном количестве высококачественных речевых записей, и, таким образом, это наиболее широко используемый метод синтеза речи в коммерческих продуктах. С другой стороны, параметрический синтез обеспечивает очень понятную и плавную речь, но имеет более низкое общее качество. Современные системы выбора звуковых единиц объединяют некоторые преимущества двух подходов, и поэтому они называются гибридными системами. Методы выбора гибридных единиц аналогичны методам классической селекции единиц, но они используют параметрический подход для прогнозирования того, какие звуковые единицы должны быть выбраны.

В последнее время глубокое обучение набирает обороты в области речевых технологий, и в значительной степени превосходит традиционные методы, такие как скрытые марковские модели (СММ), в принципе работы которых лежит разгадывание неизвестных параметров на основе наблюдаемых, при этом полученные параметры могут быть использованы в дальнейшем анализе, например, для распознавания образов. Глубокое обучение обеспечило полностью новый подход к синтезу речи, который называется прямое моделирование формы волны. Он может обеспечить как высокое качество синтеза выбора единиц, так и гибкость параметрического синтеза. Однако, учитывая его чрезвычайно высокие вычислительные затраты, реализовать его на пользовательских устройствах пока не получится.

Как работает синтез речи

Создание высококачественной системы преобразования текста в речь (TTS) для персонального помощника - непростая задача. Первый этап - найти профессиональный голос, звучание которого будет приятным, разбочивым и соответствующим личности Сири. Чтобы охватить некоторые вариации из огромного разнообразия человеческой речи требуется записать 10-20 часов речи в профессиональной студии. Сценарии записи варьируются от аудиокниг до инструкций по навигации, и от подсказок до ответов на остроумные шутки. Как правило, эта естественная речь не может использована в голосовом помощнике, потому что невозможно записать все возможные высказывания, которыми может говорить помощник. Таким образом, выбор звуковых единиц в TTS основан на разрезании записанной речи на ее элементарные компоненты, такие как фонемы, а затем их рекомбинации в соответствии с входным текстом для создания совершенно новой речи. На практике, выбор соответствующих сегментов речи и объединение их друг с другом непростая задача, поскольку акустические характеристики каждой фонемы зависят от соседних и интонации речи, что часто делает речевые единицы несовместимыми друг с другом. На рисунке ниже показано, как речь может быть синтезирована с использованием речевой базы данных, разделенной на фонемы:


В верхней части рисунка показано синтезированное высказывание «Синтез выбора единиц» и его фонетическая транскрипция с использованием фонем. Соответствующий синтетический сигнал и его спектрограмма показаны ниже. Речевые сегменты, разделенные линиями, являются непрерывными сегментами речи из базы данных, которые могут содержать одну или несколько фонем.

Основная проблема выбора звуковых единиц в TTS заключается в том, чтобы найти последовательность единиц (например, фонем), которые удовлетворяют входному тексту и предсказанной интонации, при условии, что они могут быть объединены вместе без слышимых сбоев. Традиционно процесс состоит из двух частей: front-end и back-end (входящие и выходящие данные), хотя в современных системах граница иногда может быть неоднозначной. Целью front-end является предоставление фонетической транскрипции и информации об интонации на основе исходного текста. Сюда же включается и нормализация исходного текста, который может содержать числа, сокращения и т.д.:


Используя символьное лингвистическое представление, созданное модулем текстового анализа, модуль генерации интонации предсказывает значения для акустических характеристик, таких как, например, продолжительность фразы и интонации. Эти значения используются для выбора соответствующих звуковых единиц. Задача выбора единицы имеет высокую сложность, поэтому современные синтезаторы используют методы машинного обучения, которые могут изучить соответствие между текстом и речью, а затем предсказать значения речевых функций из значений подтекста. Эта модель должна быть изучена на этапе обучения синтезатора с использованием большого количества текстовых и речевых данных. Входные данные для этой модели - это числовые лингвистические функции, такие как идентификация фонемы, слова или фразы, преобразованные в удобную численную форму. Выходной сигнал модели состоит из числовых акустических характеристик речи, таких как спектр, основная частота и продолжительность фразы. Во время синтеза обучаемая статистическая модель используется для сопоставления входных текстовых функций с речевыми функциями, которые затем используются для управления бэкэнд-процессом выбора звуковой единицы, где важны соответствующие интонации и длительность.

В отличие от front-end, бэкэнд в основном не зависит от языка. Он состоит из выбора нужных звуковых единиц и их конкатенации (то есть склейки) в фразу. Когда система обучается, записанные речевые данные сегментируются в отдельные речевые сегменты, используя принудительное выравнивание между записанной речью и сценарием записи (с использованием акустических моделей распознавания речи). Затем сегментированная речь используется для создания базы данных звуковых единиц. База данных дополнительно пополняется важной информацией, такой как лингвистический контекст и акустические характеристики каждой единицы. Используя построенную базу данных устройства и предсказанные интонационные функции, которые определяют процесс выбора, выполняется поиск Витерби (вверху - целевые фонемы, ниже - возможные звуковые блоки, красная линия - наилучшее их сочетание):


Выбор основан на двух критериях: во-первых, звуковые единицы должны иметь одну (целевую) интонацию, и, во-вторых, единицы должны быть, по возможности, объединены без слышимых сбоев на границах. Эти два критерия называются соответственно целевыми и конкатенационными расходами. Целевая стоимость - это разница между прогнозируемыми целевыми акустическими характеристиками и акустическими характеристиками, извлекаемыми из каждого блока, тогда как стоимость конкатенации представляет собой акустическую разницу между последующими единицами:


После определения оптимальной последовательности единиц отдельные звуковые сигналы конкатенируются для создания непрерывной синтетической речи.

Скрытые марковские модели (СММ) обычно используются в качестве статистической модели для целевых прогнозов, поскольку они непосредственно моделируют распределения акустических параметров, и, таким образом, их можно легко использовать для вычисления целевой стоимости. Тем не менее, подходы, основанные на глубоком обучении, часто превосходят СММ в синтезе параметрической речи.

Целью системы TTS Сири является подготовка единой модели, основанной на глубоком обучении, которая может автоматически и точно прогнозировать как целевые, так и конкатенационные затраты для звуковых единиц в базе данных. Таким образом, вместо СММ использует смесь плотности сети (СПС, mixture density network) для прогнозирования распределений по определенным признакам. СПС объединяют обычные глубокие нейронные сети (ГНС) с гауссовскими моделями.

Обычный ГНС представляет собой искусственную нейронную сеть с несколькими скрытыми слоями нейронов между входным и выходным уровнями. Таким образом, ГНС может моделировать сложную и нелинейную зависимость между входными и выходными характеристиками. Напротив, СММ моделирует распределение вероятностей выходных данных с учетом входных данных с использованием набора гауссовых распределений, и обычно обучается с использованием метода максимизации ожидания. СПС сочетает преимущества ГНС и СММ, используя ГНС для моделирования сложной взаимосвязи между входными и выходными данными, но обеспечивая распределение вероятностей на выходе:


Для Siri используется унифицированная целевая и конкатенационная модели на основе СПС, которые могут прогнозировать распределение как целевых характеристик речи (спектра, высоты тона и продолжительности), так и стоимости конкатенации между звуковыми единицами. Иногда речевые особенности, такие как аффиксы, довольно стабильны и развиваются медленно - например, в случае гласных. В другом месте речь может изменяться довольно быстро - например, при переходе между озвученными и невокализованными звуками речи. Чтобы учитывать эту изменчивость, модель должна иметь возможность корректировать свои параметры в соответствии с вышеупомянутой изменчивостью. СПС делает это используя отклонения, встроенные в модель. Это важно для улучшения качества синтеза, поскольку мы хотим рассчитать целевые и конкатенационные издержки, характерные для текущего контекста.

После подсчета единиц на основе общей стоимости с использованием СПС выполняется традиционный поиск по Витерби, чтобы найти лучшее сочетание звуковых единиц. Затем они объединяются с использованием метода совпадения с перекрытием формы волны, чтобы найти оптимальные моменты времени конкатенации для создания плавной и непрерывной синтетической речи.

Итоги

Для использования СПС в Сири было записано как минимум 15 часов высококачественных речевых записей на частоте 48 кГц. Речь была разделена на фонемы с использованием принудительного выравнивания, то есть было применено автоматическое распознавание речи, чтобы выровнять входную звуковую последовательность с акустическими характеристиками, извлеченными из речевого сигнала. Этот процесс сегментации привел к созданию примерно 1-2 миллионов фонем.

Чтобы провести процесс отбора звуковых единиц на основе СПС была создана единая целевая и конкатенационная модели. Входные данные для СПС состоят в основном из двоичных значений с некоторыми дополнительными функциями, которые представляют собой информацию о контексте (по две предшествующих и следующих фонемы).

Качество новой системы TTS Сири превосходит предыдущую - это подтверждают многочисленные тесты на картинке ниже (интересно, что лучше всего оценили как раз новый русский голос Сири):


Лучшее качество звука связано как раз с базой данных на основе СПС - это обеспечивает лучший выбор и конкатенацию звуковых блоков, более высокую частоту дискретизации (22 кГц против 48 кГц) и улучшенное сжатие звука.

Прочесть оригинал статьи (требуется хорошее знание английского и физики), а также послушать, как менялся голос Сири в iOS 9, 10 и 11, можно .

Роль смартфонов в жизни каждого из нас становится значительно заметнее. Мы проводим с портативными мобильными устройствами большую часть своего времени, а поэтому, можно сказать, постоянно находимся на связи как в мобильной сети, так и на различных социальных платформах, вроде Twitter и Facebook.

Но что примечательно: смартфоны успели стать нашими помощниками, которые организовывают рабочий день, помогают устанавливать цели и достигать их, контролируют наше поведение (в какой-то мере). Одним из инструментов, который облегчает жизнь пользователя, является Siri. Как включить этого «помощника» на вашем телефоне, что это такое, и как это работает, мы расскажем в данной статье.

Технология Siri

Итак, начнем с того, что технология, по которой функционирует система Siri, - это, фактически, опыт многолетних разработок огромной группы ученых. Если верить официальной информации, то еще около 40 лет назад разработчики трудились над тем, чтобы создать прототип искусственного интеллекта, который мог бы собирать, анализировать и реагировать на информацию, поступающую из окружающей среды. Siri, базирующаяся на этих технологиях, по сути, вобрала в себя указанные разработки. А Apple, представившая платформу на рынке как дополнение к своему продукту, стала одним из первооткрывателей эры искусственного интеллекта в смартфонах. И, по сути, благодаря работе многих ученых, сегодня пользователь может работать с Siri. Что это - подробнее расскажем далее.

Siri на iPhone

На смартфоне от Apple - iPhone (начиная с модели 4S и заканчивая последней, - Siri представлена в виде простого приложения. Ее можно установить из каталога программ для устройств, работающих с операционной системой iOS, и запустить простым нажатием кнопки.

Помимо возможности дополнительной загрузки Siri, iPhone располагает этой программой как одной из базовых. Таким образом, даже если пользователь не знает о существовании Appstore, уже после покупки телефона он может использовать этого «помощника».

Несмотря на то что Siri работает по принципу определения речевых запросов, это не ограничивает пользователей из большинства стран с точки зрения языковой интеграции. Это достигается компанией-разработчиком за счет того, что программа имеет до 20 версий, работающих с разными языками. Разумеется, в наличии есть и Siri на русском, которая доступна на территории РФ.

Функции Siri

У пользователя, который еще не сталкивался с данным приложением, возникает логичный вопрос: а что конкретно входит в функции Siri? Собственно, чем эта программа может помочь владельцу телефона, и зачем она нужна?

Ответ прост: приложение исполняет функции персонального ассистента. В его «обязанности» (если корректно употребить такое слово в отношении приложения) входит распознавание команд пользователя, их обработка и, конечно же, надлежащая реакция. Именно таким образом можно охарактеризовать основную функцию приложения.

А что касается конкретных задач, с которыми работает Siri, то это, по сути, те же задания, которые выполняет и ваш смартфон. Учитывая, на iPhone, можно сказать, что данное приложение позволяет обращаться к телефону с различными просьбами и ожидать, пока он выполнит задание.

Особенности программы

Разумеется, технологий, которые бы позволяли вашему iPhone абсолютно точно «понимать» вас исключительно по голосу, пока не существует. Siri - это лишь попытка создать такое универсальное и рабочее решение, но и она не идеальна. Поэтому нужно знать, на iPhone 5 (как, впрочем, и на любой другой модели). В частности, нужно стараться делать максимально корректные запросы (например, «Позвонить маме», «Открыть карту» и так далее). Делать обращения к смартфону в произвольной форме не стоит (особенно если речь идет не об английском языке, на котором Siri распознает лучше всего).

Еще одна особенность, конечно же, - это четкость речи и, в частности, тех слов, которые вы произносите для Siri. Что это за фразы будут, и насколько отчетливо вы будете их произносить - решать вам. Но помните, что от этого зависит степень распознавания программой вашего голоса. Например, если давать команду в шумной обстановке, «помощник» вас, скорее всего, «не поймет».

Доступные языки

Вы спросите, а какие же доступны в Siri языки? Отвечаем: это английский, датский, голландский, шведский, русский, итальянский, французский, испанский, кантонский, датский, китайский, корейский, немецкий, тайский, турецкий и японский. Наличие языка в данном списке означает, что на нем люди могут делать запрос программе, и она «поймет», чего хочет пользователь.

Следует отметить такую особенность: каждый из этих языков доступен не на всех версиях iOS. Около половины было добавлено относительно недавно, начиная с модификации 8.3.

Как работать с Siri?

В этой части статьи опишем процедуру того, что необходимо, чтобы начать работать с Siri (как включить приложение, по сути). Итак, рассматриваем два возможных варианта: если у вас есть предустановленная программа (которая идет сразу с новым устройством), то в таком случае предпринимать каких-либо специальных действий не нужно. Запускается программа, как уже было сказано выше, длительным нажатием на кнопку Home. Если вы не пользуетесь этой функцией и не желаете вызывать «помощника» таким способом - можете отключить ее в настройках.

Другой вариант - это когда у вас, по какой-то причине нет Siri, и вы хотели бы установить ее «с нуля». Это делается несложно: достаточно зайти на Appstore и установить ее, как и остальные программы. Далее можно заходить в Siri с рабочего стола, запуская ее в нормальном режиме.

Никакой активации или дополнительной регистрации программа не требует. В этом и прелесть данной разработки - при всей широте ее возможностей, в Apple представили ее в максимально упрощенном виде. Интерфейс в итоге получился простым и понятным.

Как пользоваться?

А использовать Siri (что это и как устроено, в целом мы, думаю, разобрались) очень просто. Запустив приложение, вы увидите новое окно, показывающее строку (как в диктофонах). Кроме того, запуск Siri сопровождается еще и характерным звуком (специфический «двойной» сигнал), после которого произносится фраза «Hello, how can i help you?» на английском (или «Чем могу помочь?» на русском). После этого вы можете произносить фразу, обозначающую нужную вам команду: «"Сири", покажи мне ближайшие рестораны», например.

После того как ваша речь будет записана, программа подаст еще один сигнал, за которым сразу же последует ответ.

Перспективы и возможности

На самом деле, вся информация об этом приложении является общей. Мы знаем, как помогает Siri. Что это - продукт, который в будущем способен «научиться» выполнять все без исключения наши требования (и тогда-то он и станет действительно удобным).

Интересно, а можно ли как-то применить эту разработку в других сферах?

Специалисты утверждают, что за такими программными решениями, как Siri, будущее человечества. Возможно, когда-то искусственный интеллект сможет решать нам самые сложные задачи, делать невероятные вычисления, отвечать на те вопросы, ответов на которые нам, людям, найти не удалось.

Существует также теория о том, что Siri - это просто бесполезный «наворот» Apple, который, к тому же еще и не распознает речь на нужном уровне.

Как бы там ни было, а на английском языке (в США, в частности), люди действительно пользуются этим приложением активнее, чем во всех других странах. Здесь Siri интегрирована во многие другие пользовательские онлайн-сервисы, выпущенные компаниями Yahoo, Google, Yandex, Facebook и множество других. Задача каждого из них - сделать так, чтобы пользователь, работающий со своим iPhone, мог выполнить любое действие «без рук», просто раздавая команды вербально. Возможно, такие разработки приведут действительно к чему-то интересному на рынке.

Аналоги на других платформах

Еще следует отметить, что технология Siri не является оригинальной или новой на рынке мобильных устройств. Для того чтобы понять это, достаточно взять какой-нибудь передовой Samsung и найти там функцию Да, на устройствах корейской компании такие приложения работают менее точно, чем на смартфонах с iOS; однако, вполне возможно, что в один прекрасный момент Apple уступит свое лидерское место технологически передовой компании.

Помимо того, есть еще ряд менее известных наработок, которые существуют в виде небольших стартапов и также работают над распознаванием голоса. Пока, разумеется, каких-то «громких» прорывов в этой сфере не наблюдается, но и сказать, что она стоит на месте, нельзя. С помощью голоса, к примеру, уже можно управлять мультимедиа-системой в автомобиле, что позволяет снизить уровень опасности на дорогах. Подобный механизм может быть применен еще в самых разных сферах - и он может действительно помочь улучшить нашу жизнь.

А пока даже тот факт, что на вашем iPhone установлен собственный «помощник», радует. Ведь достаточно двух слов, чтобы позвонить близкому человеку. А быть может, Siri даже смогла спасти чью-то жизнь?!

На самом деле принадлежит вполне реальному человеку. Каково это — «озвучить» виртуального помощника Apple? Издание Vox обратилось с этим вопросом к актрисе Сьюзан Беннет , голосом которой и говорит Siri .

Вконтакте

Госпожа Беннетт — известный по всему миру «голос за кадром». Кроме работы на Apple, она озвучивает рекламу, поет и наделяет своим голосом самые разные сервисы и продукты многих других компаний.

Беседа со Сьюзан — вещь сюрреалистическая. В какой-то момент она разговаривает с вами так же, как и всегда… и вы чувствуете, что у нее самый приятный голос из всех тех, что вы когда-либо слышали. Далее она «включает» манеру общения Siri — и создается впечатление, что вы общаетесь не с человеком, а с компьютером.

В профессии Сьюзан Беннетт работает с 70-х гг прошлого века. Десятилетиями она записывает текст для автоответчиков, систем звукового и речевого оповещения («стандартный» голос в аэропорту, на стадионе и т.п.) и самых разных клиентов — от крупных корпораций до малого бизнеса.

В 2005 году Беннетт записала голос для Siri . Тогда она и понятия не имела о том, что ее работа будет знакома каждому пользователю iPhone в США — компания-создатель Siri еще не была выкуплена Apple. Приложение с голосом Сьюзан появилось в App Store в 2010 году, а год спустя уже было встроено в iOS и работало по умолчанию на новом флагмане Apple — iPhone 4S.

«Я записывала по четыре часа каждый день, пять дней в неделю, в течение всего июля . Для актера-закадрового голоса такой объем работы — серьезная нагрузка, это слишком долго. Со временем устаешь».

Записывать «компьютерный» голос вроде того, что получила Siri , особенно трудно. Актер не читает осмысленные слова или предложения; в его задачу входит произнесение случайных слов с наличием в них так называемых «базовых» звуков — гласных, согласных, слогов и дифтонгов. Из них голосовой помощник Apple и строит уже осмысленные ответы. Например, Сьюзан нужно было произнести слова с буквой «S» во всех возможных вариантах произношения — и актриса надиктовывала настоящий «набор слов». Особого смысла в нем не было, выглядело это, по признанию самой Сьюзан, откровенно глупо.

Беннетт думает, что сегодня в записи Siri участвуют несколько других актеров. Это сделано для того, чтобы улучшить качество сервиса и дать пользователям больше вариантов.

Долгие годы Сьюзан скрывала тот факт, что «голос» Siri дала именно она — большинство актеров-«закадровых голосов» предпочитают лишний раз не светиться на публике, ведь после признания от славы уже не скрыться. Пойти на «каминг-аут» ее заставила ошибка журналистов The Verge — те решили, что Siri озвучивала не она, а другая актриса.

Рынок закадровых голосов является высококонкурентным, так что Беннетт решила не давать коллеге по работе очевидного преимущества (только представьте, что означает фраза в резюме «Я озвучивала Siri»!). Сегодня благодаря новейшим технологиям, рассказывает актриса, получить отличный заказ может каждый — достаточно иметь подключение к Интернету и несколько тысяч долларов на оборудование. Сама Сьюзан, как и многие коллеги, работает из дома. Там у нее оборудована студия, которая привела бы в восторг любого фаната аудиотехнологий. Чего стоит хотя бы один микрофон Neumann TLM 193 за $1 600!


Сьюзан Беннетт
заботится о своем голосе: часто пьет теплую воду вместо чая, иногда принимает в пищу мед и старается не прочищать горло.

А можно ли стать актером-специалистом по озвучке? Да, но это не для каждого, говорит Сьюзан, ведь голос — это врожденное:

Сьюзан Беннетт уверена: компьютеры никогда не смогут заменить человеческий голос — нечто в нем не поддается симуляции. Что и говорить — машина никогда не сможет заговорить сначала голосом Siri , а затем от души рассмеяться как самый обычный человек.