Synthesizer V — музыкальное программное обеспечение, синтезатор речи, имеющий 3 поколения: Synthesizer V, Synthesizer V Studio, и Synthesizer V Studio 2[1].
Каньжу Хуа заявил в Twitter, что первая строка кода, the proto-proto libllsm (написанная в марте 2015 года), в конечном итоге стала частью Synthesizer V.[2] Разработка Synthesizer V началась в 2017 году. Каньжу Хуа выпустил демо[3] с тремя вокалами, известными в то время как ENG-F1 (позже выпущенную как Eleanor Forte), JA-F1 и MAN-M1. Synthesizer V впервые официально дебютировал 1 декабря 2017 года.[4] В августе 2018 года Каньжу Хуа выпустил «Техническую предварительную» версию Synthesizer V.
31 декабря 2019 года была выпущена интергрированная в интернет-браузер веб-версия Web Synthesizer V с одним японским женским вокалом JA-F2[5][6]. В сотрудничестве с AH-Software Co. Ltd. 22 июля 2020 года Dreamtonics выпустила обновленную версию движка, включающую в себя два женских японских вокала: Kotonoha Akane & Aoi и Saki. В настоящее время имеет только 2 вокала.
31 мая 2019 года Каньжу Хуа объявил в Твиттере, что он принимает заявки на инженеров-программистов C++ для работы над следующей версией Synthesizer V, которая стала известна как Synthesizer V Release 2. Позже в 2020 году она станет известна как Synthesizer V Studio.
Synthesizer V Studio Pro и Synthesizer V Studio Basic были официально анонсированы 26 июня компанией AH-Software Co. Ltd. в пресс-релизе, как и голосовые базы данных Kotonoha Akane & Aoi и Saki.
Обновление для Synthesizer V Studio под названием Synthesizer V AI было официально анонсировано 30 октября 2020 года компанией Dreamtonics в пресс-релизе, как и голосовые базы данных Saki AI и Koharu Rikka, которые должны распространяться AH-Software Co. Ltd.
Демонстрации для Synthesizer V AI были загружены на каналы YouTube Dreamtonics и AH-Software Co. Ltd. соответственно, демонстрируя Saki AI. Также было загружено сравнительное видео между стандартным вокалом Synthesizer V Studio Saki и версией AI[7].
23 декабря была выпущена версия 1.5.0, которая принесла новые комплексные обновления для войсбанков на основе ИИ. Ее основным обновлением стал межъязыковой синтез, который позволил голосовым базам данных ИИ петь на английском, японском и китайском языках независимо от того, изучал ли вокалист эти языки или нет[8]. Ранее войсбанки были ограничены только языковым знанием поставщиков голосов, на которых они были основаны. К этому времени все выпущенные войсбанки ИИ получат обновление для поддержки межъязыкового синтеза, и новая функция будет доступна только для редактора Pro.
О запуске Synthesizer V Studio 2 было объявлено 24 декабря 2024 года в сообщении на официальном аккаунте Dreamtonics Co., Ltd. в Twitter, а также одновременно было объявлено о его презентации на предстоящей выставке NAMM 2025 в конференц-центре Анахайма, которая прошла с 23 по 25 января[9][10]. 13 февраля в магазине Dreamtonics International Store и магазине AHS компании AH-Software Co. Ltd. открылись предварительные заказы на Synthesizer V Studio 2 Pro, а также на различные войсбанки Synthesizer V 2 AI, с подтвержденной датой выпуска 21 марта согласно листингу Amazon Japan (который был восстановлен на следующий день)[11][12]. В магазине Dreamtonics Store SVS2 Pro предлагался (только в формате цифровой загрузки) как отдельный редактор и как пакет с любым войсбанком SV2 AI по выбору пользователя; также была предложена очень выгодная версия обновления в течение ограниченного времени зарегистрированным владельцам уходящего редактора Synthesizer V Studio Pro, который должен быть снят с продажи, как только выйдет новая версия. В магазине AHS Store предлагались как физические, так и цифровые версии редактора SVS2 Pro, а также только физический стартовый пакет, который, как и в случае с уходящим стартовым пакетом SVS Pro (который также должен был быть прекращен 21 марта), включал купон, который можно было использовать (после выпуска) для любого цифрового войсбанка из утвержденного списка, предоставленного AH-Software (включавшего не только вокал Synthesizer V 2 AI, но также вокал Synthesizer V Standard и Synthesizer V AI, изначально разработанный для старого редактора SVS Pro).
25 января 2025 года Dreamtonics опубликовала видео, демонстрирующее рабочую версию программного обеспечения[13]. Ниже приведен неполный список функций, показанных в этом видео:
По утверждению разработчиков, Synthesizer V Studio сочетает в себе Standard-ные и новые модели синтеза вокала с использованием искусственного интеллекта (AI). Программа не требует от пользователя каких-либо сложных манипуляций и способна во время работы совершать переход от обычных сэмплов к настоящей записи человеческого голоса, когда это необходимо. Базовая версия синтезатора распространяется бесплатно, но образцы голоса в ней являются облегчёнными (Lite) и уступают в технических возможностях улучшенной версии[1][15].
Стандартные войсбанки являются войсбанками, записанные с отдельными сэмплами, как в таких программах как VOCALOID (1, 2, 3, 4, 5) и UTAU. Они были в первом синтезаторе Synthesizer V и ранних войсбанках Synthesizer V Studio. VOLOR и Eclipsed Sounds, LLC отметили, что стандартные войсбанки должны быть записаны в студии Dreamtonics в Токио, Япония[16]. Для сравнения, войсбанки AI используют запись на основе песен и дадут возможность сделать это удаленно, при этом машинное обучение будет выполняться только Dreamtonics.[17] Также было отмечено, что банки AI могут звучать совсем иначе, чем Standard аналоги, но также могут привнести больше экспрессии. В целом стандартные банки звучат более роботизировано[18]. К настоящему времени они больше не производятся.
Сэмплы с голосами войсбанков находятся в файлах с расширением «svpk»[19]. Голосовые провайдеры Элеоноры Форте, Саки и многих других неизвестны, потому что их голосовые образцы являются исключительной собственностью компании «Dreamtonics», которая подписала с голосовыми провайдерами договор о неразглашении конфиденциальной информации[20].
Synthesizer V Studio в настоящее время поддерживает межъязыковой синтез для японского, английского, севернокитайского (мандарин), кантонского, испанского и корейского (только в Synthesizer V Studio 2). (См. Фонология). Межъязыковой синтез поддерживается только для голосовых банков с ИИ, в про-версиях Synthesizer V Studio Pro и не поддерживается в облегченных ИИ версиях банков (Lite).
В 2024 году в Университете Торонто Метрополитен было объявлено о разработке корейского и французского для Synthesizer V Studio[21]. В итоге корейский стал доступным в Synthesizer V Studio 2[22].
Вокал-моды (англ. Vocal Mode) - это разные тона вокала, такие как "Soft" и "Whisper". Они не поддерживаются в облегченных Lite-версиях войсбанков. У разных банков может быть разное количество вокал-модов: у NOA доступно 13 вокал-модов: "Attack", "Solid", "Clear", "Deep", "Flow", "Glow", "Husky", "Nasal", "Power", "Smooth", "Twangy", "Vivid", "Waltz" и "Whisper"[23]; тем временем как у Mai их два: "Emotional" и "Soft". Обновленная Mai 2 теперь имеет 6 вокал-модов: "Breathy", "Downer", "Emotional", "Powerful", "Rap" и "Sweet"[24]. В настоящее время самое большое количество вокал-модов у UNI для Synthesizer V Studio 2. У нее их 16: "Normal", "N_Bright", "N_peaceful", "Bold", "Bold_dynamic", "Charming", "Delicate", "Emotive_dynamic", "Mature", "Moody", "Playful", "Resonant", "Resonant_dynamic", "Soulful", "Tempting", "Whisper"[25].
aa
ae
ah
ao
ax
ih
iy
eh
er
uh
uw
aw
ay
ey
ow
oy
b
ch
d
dx
dr
dh
f
g
hh
jh
k
l
m
n
ng
p
r
s
sh
t
tr
th
v
w
y
z
zh
Также см. Английская фонология
a
i
u
e
o
N
j
ts
h
ry
ky
py
dy
ty
ny
hy
my
gy
by
kw
gw
A
@
7
U
i\
i`
AU
@U
ia
iA
iAU
ie
iE
iU
i@U
y{
yE
ua
uA
u@
ue
uo
:\i
z`
:n
ph
kh
ts`
ts`h
tsh
ts\
ts\h
x
s`
s\
kwh
6
E
I
O
9
8
m=
N=
:i
:u
:m
:N
:p_}
:t_}
:k_}
ll
B
D
rr
J
C
j 6
V
j V
e_o
j e_o
j u
M
M j
w 6
w V
w e_o
w i
dz\
k_t
k_h
p_t
p_h
4
s_t
t_t
t_h
ts \_t
ts \_h
cl
br
brl
sil