Огляд

Darktable використовує моделі машинного навчання для кількох завдань обробки зображень: інтерактивне маскування об’єктів, знешумлення, масштабування тощо. У цьому розділі пояснюється, як ці функції працюють комплексно – що де працює, які моделі існують, як прискорюється генерація (“інференс”) і що насправді контролює вибір користувача в налаштуваннях ШІ.

Функції ШІ вмикаються користувачем. Вони вимкнені за замовчуванням після нової інсталяції та можуть бути будь-коли увімкнені/вимкнені за допомогою одного налаштування.

Функції ШІ також мають бути присутніми у бінарному файлі Darktable. Офіційні збірки (Linux AppImage, інсталятор Windows, macOS dmg) усі їх містять. Сторонні пакувальники можуть постачати збірку без підтримки ШІ – у такому випадку вкладка ШІ повністю відсутня в налаштуваннях. Попросіть супроводжувача пакету вашого дистрибутива ввімкнути підтримку ШІ або використовуйте офіційну збірку.

🔗Що роблять функції ШІ

🔗Завдання

Завдання – це слот можливостей всередині Darktable – “створити маску навколо об’єкта, на який натиснули”, “усунути шум із зображення RGB” тощо. Завдання відокремлені від моделі, яка їх реалізує: кілька конкуруючих моделей можуть знаходитися на диску для одного й того ж завдання (знешумлювач NIND, знешумлювач NAFNet, експериментальна третя…), але лише одна з них є активною для цього завдання в будь-який момент часу, і саме її споживають модулі Darktable. Перемикання активної моделі здійснюється одним кліком миші в налаштуваннях ШІ і не вимагає змін до жодного модуля – споживач просто запитує “активну модель знешумлення” та отримує ту, яку ви вибрали.

Така архітектура забезпечує гнучкість, завдяки чому репозиторій моделей може публікувати альтернативні або покращені моделі без необхідності того, щоб Darktable знав про них заздалегідь: виберіть модель у налаштуваннях, і кожен користувач цього завдання автоматично її обере.

Darktable зараз надає доступ до чотирьох завдань:

mask: Інтерактивна сегментація об’єктів. Клікніть на об’єкті в Темній кімнаті, і модель створить навколо нього маску, векторизовану в групу контурних фігур, які можна редагувати, як і будь-яку іншу намальовану фігуру. Використовується фігурою намальованої маски об’єкта ШІ для вибору областей без малювання вручну. Працює на таких моделях, як SAM 2.1 та SegNext.
denoise: Знешумлення даних RGB з машинним навчанням як альтернатива класичним модулям знешумлення. Працює з RGB-зображеннями, навченими на парах шумних та чистих зображень. Видаляє шум сенсора без блочного або згладженого вигляду, який може виникати від традиційних фільтрів. Використовується вкладкою Знешумлення модуля Нейронне відновлення.
rawdenoise: Знешумлення за допомогою машинного навчання застосовується безпосередньо до сирих даних з сенсора перед демозаїкою, при цьому знешумлення та демозаїка об’єднуються в один прохід генерації (“інференсу”). Результат зберігається як LinearRaw DNG та реімпортується, тому подальша обробка в Темній кімнаті залишається незмінною. Корисно, коли потрібно врахувати шум сенсора перед запуском алгоритму демозаїки. Використовується вкладкою Знешумлення raw модуля Нейронне відновлення.
upscale: 2-кратне та 4-кратне збільшення роздільності зображення, що створює правдоподібні деталі з низькороздільних вхідних даних. Корисно для маленьких або обрізаних зображень, де класична інтерполяція призведе до розмиття. Використовується вкладкою Збільшення модуля Нейронне відновлення.

Завдання виконуються лише тоді, коли їх активує користувач – немає безперервної фонової активності ШІ, телеметрії та хмарного компонента. Все працює локально на вашому комп’ютері.

🔗Примітка щодо точності

Як і будь-яка система машинного навчання, функції ШІ в Darktable не ідеальні. Кожна модель має граничні випадки, коли її результат виглядатиме гірше, ніж класична альтернатива – незвичайні об’єкти, екстремальна експозиція або контент, далекий від того, на чому навчалася модель. Це є невід’ємною частиною роботи машинного навчання, а не помилкою: 100% точність для всіх можливих вхідних даних – це не те, що може запропонувати жодна модель – наша чи чиясь інша.

Що моделі можуть запропонувати, це стабільно хороші результати у типових випадках, для яких вони були розроблені. Правильний підхід полягає в тому, щоб ставитися до функцій ШІ як до інструменту, який зазвичай кращий за класичну альтернативу, і залишати класичні модулі доступними як резервний варіант для меншості зображень, де результат роботи ШІ не кращий. Якщо ви знайдете випадок, коли модель ШІ дає помітно поганий результат, будь ласка, повідомте про це, щоб модель можна було покращити з часом.

🔗Чого не робить Darktable

Darktable використовує вузький ШІ – невеликі, специфічні для певних завдань моделі, які працюють на вашому комп’ютері та виконують одне чітко визначене завдання (знешумлення, створення маски, масштабування). Він не використовує великі генеративні моделі, які можуть перезаписувати фотографії – жодних замін неба, вставки об’єктів, перенесення стилів, синтезованого контенту будь-якого виду. Повний обсяг викладено в Політиці інтеграції моделей ШІ проекту; керівним принципом є цілісність сцени: ШІ може виправляти технічні дефекти зйомки, але не може змінювати те, що було перед камерою.

Технічні гарантії:

Без хмарної генерації (“інференсу”): Кожна модель працює локально на вашому CPU або GPU. Ніщо про ваше зображення не надсилається за межі пристрою.
Без автономного редагування: Кожна функція ШІ активується користувачем; у вашій бібліотеці немає фонової активності ШІ.
Без навчання: Darktable постачає попередньо навчені моделі та виконує лише генерацію (“інференс”). Репозиторій darktable-ai містить скрипти перетворення та нотатки щодо навчання для тих, хто хоче перенавчити або експортувати нову модель.
Без автоматичних оновлень: Моделі завантажуються, коли ви запитуєте їх у налаштуваннях; нічого не відбувається у фоновому режимі.
Без аналітики: Darktable нікуди не повідомляє про використання моделі, вибір постачальника виконання чи ефективність генерації.

translations

English: overview