Kuaishou, един от основните конкуренти на китайския брат на TikTok Douyin, демонстрира няколко свежи функции за своя модел текст към видео Kling AI на Световната конференция за изкуствен интелект (WAIC) в Шанхай миналата седмица, включително възможността за генериране на видеоклипове до 10 секунди.

В WAIC посетителите се изредиха на опашка, за да опитат инструмента, подобен на Sora, който в момента е достъпен само с покана. Потребителите изпратиха прости подкани за генериране на видеоклипове, като например „панда, която яде сьомга“ и „Мона Лиза, която слага очилата си с ръце“, като получените клипове демонстрират способността на Kling AI да рендира входовете почти перфектно.

Видеоклипове, генерирани от AI, впоследствие наводниха китайския интернет, като Kling AI се използва за създаване на клипове, включващи герои от исторически филми, изпълняващи съвременни задачи и създаващи множество меми.

Видеоклип с участието на Ронг Момо, герой от „Моята прекрасна принцеса“, който се превърна в добре известен интернет мем в Китай, който храни принцеса Зиуей с пилешко бутче, стана вирусен в социалните платформи тези дни. Видеото, генерирано от AI, се основава на най-известната сцена от драмата, в която Rong momo измъчва Ziwei, като я пробожда многократно с игла.

Екранна снимка на видео, генерирано от AI, показва как Rong momo храни принцеса Ziwei с пилешко бутче. кредит: Интернет

Защо има значение: Kuaishou ще се надява, че неговият пакет от самостоятелно разработени големи серии модели, включително езиков модел KwaiYii, фокусиран върху изображения Kolors и видео-центриран Kling, ще му даде предимство, докато продължава да предизвиква Douyin и TikTok на ByteDance.

Подробности: Повече от 500 000 потребители са кандидатствали за помощ при бета тестване на Kling, старши вицепрезидент на Kuaishou Gai Kun разкри миналия уикенд на форум на WAIC, като броят на генерираните видеоклипове достига 7 милиона към момента. Ажиотажът на съперника на Sora е такъв, че публикации на английски език, обучаващи потребители извън Китай как да кандидатстват за изпитание на Kling AI, могат да бъдат намерени на X, известен преди като Twitter.

  • Kuaishou предостави практически съвети на екрана на събитието WAIC, включително съветване на потребителите да използват прости думи и структури на изречения и да избягват прекалено сложния език. Той също така подчерта, че неговият модел не е чувствителен към числата, като даде пример, че ако подканата е „10 кученца на плажа“, числото може да не се поддържа последователно в резултатите.
  • Член на екипа от големия езиков модел на Kuaishou каза пред TechNode, че нямат право да разкриват данните, използвани за обучение на Kling AI, но посочи, че те са с отворен код.
  • Съперникът на TikTok междувременно обяви на WAIC, че неговият модел Kolors, подобен на Midjourney, ще стане с отворен код, ход, който според Kuaishou цели да допринесе за по-просперираща екосистема за общността за генериране на текст към изображение.
  • Инвестициите на Kuaishou в научноизследователска и развойна дейност са се учетворили за четири години, като разходите са се увеличили от 2,9 милиарда RMB през 2019 г. до 12,3 милиарда RMB през 2023 г.

Контекст: Kuaishou, втората по големина китайска компания за късометражно видео, стартира своята стратегия за AI през 2023 г., според главния изпълнителен директор Cheng Yixiao, който каза, че генеративният AI има „много богата комбинация от бизнес сценарии и огромен потенциал за стойност“ за платформата за съдържание.

Бележка на редактора: „Landing AI“ е поредица от специални доклади, фокусирани върху областта на изкуствения интелект, курирани от TechNode. Като изследваме развитието на AI, кацане в Китай и историите зад кулисите на индустрията, ние ще се потопим по-дълбоко във всичко, което е възможно под новата вълна на AI.

Свързани

Нашия източник е Българо-Китайска Търговско-промишлена палaта

By admin