Истражување направено од страна на Wired покажа дека повеќе доста успешни компании, вклучувајќи ги и Apple и Nvidia, користеле YouTube содржина без дозвола за тренирање на нивните јазични модели за вештачката интелигенција.
Поточно, користени биле преводи од YouTube видеа, а тие биле дел од поголема дата база наречена „The Pile“ од непрофитната организација EleutherAI.
Ваквата практика е нешто што веќе претставува проблем, а се очекува во иднина да биде уште поголем проблем. Компаниите кои развиваат вештачка интелигенција мораат да ги тренираат нивните јазични модели на некаква содржина, па често се одлучуваат тоа да го направат без да платат, односно легално и јавно да ја лиценцираат.
Apple за време на својата презентација истакна дека не користи вакви тактики, но сепак испадна дека тоа не било баш така. Тие ја имаат користено дата базата за тренирање на нивниот јазичен модел OpenELM, кој е со отворен код.
Сепак, од компанијата истакнуваат дека овој модел веќе не го развиваат, а дека ништо што се користи во Apple Intelligence не е тренирано на овој начин. Дали е тоа навистина така изгледа ќе мора да се види доколку излезе некое ново истражување во иднина.
Во продолжение можете да ја погледнете кратката реакција од страна на Маркез Браунли кој е сопственик на еден од YouTube каналите кои биле дел од дата базата.