Подяки
Ascolta — це пропрієтарне програмне забезпечення, але воно спирається на чудові напрацювання з відкритим кодом. Моделі транскрипції працюють на вашому Mac і завантажуються безпосередньо від їхніх видавців під час першого використання — ми не вбудовуємо й не поширюємо їх. Ось усе, на чому ми будуємо, з вдячністю.
Розпізнавання мовлення на пристрої
- WhisperKit від Argmax — обробка Whisper на пристрої. Використовується за ліцензією MIT. github.com/argmaxinc/WhisperKit
- FluidAudio від FluidInference — обробка Parakeet на пристрої та завантаження моделей. Використовується за ліцензією Apache-2.0. github.com/FluidInference/FluidAudio
Моделі мовлення
Моделі транскрипції завантажуються на ваш Mac із Hugging Face під час першого використання й працюють повністю офлайн. Ascolta не поширює ваги моделей.
- Parakeet TDT 0.6B (v2 та v3) від NVIDIA, упаковано для Core ML командою FluidInference — використовується за CC-BY-4.0, із зазначенням авторства NVIDIA. FluidInference/parakeet-tdt-0.6b-v3-coreml
- Whisper та Distil-Whisper від OpenAI і команди Hugging Face — використовуються за ліцензією MIT.
Фреймворки застосунку
- Sparkle — безпечні оновлення застосунку. Використовується за ліцензією MIT. sparkle-project.org
- Пакети Swift від Apple (swift-crypto, swift-collections, swift-argument-parser, swift-asn1) та Hugging Face (swift-transformers, swift-jinja) — використовуються за ліцензіями MIT і Apache-2.0.
Необов’язкова хмарна транскрипція
Якщо ви вирішите підключити хмарного провайдера зі своїм власним ключем API, аудіо надсилається цьому провайдеру для транскрипції на його умовах. За замовчуванням це вимкнено. Провайдери: OpenAI (gpt-4o-mini-transcribe) та Groq (whisper-large-v3-turbo).
Дякуємо
Усім, хто створює та підтримує програмне забезпечення вище, і тим, хто думає вголос. Питання щодо ліцензування? Пишіть на support@ascolta.app.