Вижте заключенията на един скорошен анализ от учените в училището по информатика и компютърни системи в университета в Индиана, на фалшива срещу истински чуруликане memes , които могат да имат сериозни последици за корпоративни социални маркетингови кампании в бъдеще. Превъртете надолу до интересна точка, отбелязани с удебелен шрифт. (PDF: Fake-tweets-идентификатор)
В тази работа ние предложи рамка за справяне с проблема за клъстериране memes в социалните медии потоци Twitter по-специално. Нашата система се основава на предварително клъстериране процедура, наречена protomeme откриване, целящо да идентифицира атомна белезите на информацията, съдържаща се във всеки чуруликане. Тази стратегия изисква само обработка на текст, затова е особено ефективен и подходящ за стрийминг сценарий. Memes, след това се получават чрез обединяване protomemes въз основа на сходство между тях, изчислени от ad hoc мерки, определени според различни размери, включително съдържание, социална мрежа и модели за разпространение на информация. Тези мерки само приемат информация, която може да бъде извлечен в стрийминг мода от наблюдаваните данни, и те позволяват да се изгради клъстери на локално свързани tweets. Meme групиране се извършва с помощта на променлив мравка онлайн K-средства, които интегрират s памет с механизъм за проследяване на най-слабо наскоро нагоре с дата memes. Ние използва dataset състои от тенденция hashtags на Twitter за периодична оценка на изпълнението на нашия алгоритъм и показахме, че нашия метод превъзхожда базовата линия, която използва само чуруликане текст, както и един, който предполага пълно познаване на основните социална мрежа.
Една изключително важна черта на нашата система е, че тя може в е разширена да работи с всеки клъстериране алгоритъм, въз основа на сходство (или разстояния). В тази книга например, ние избрахме да представя Onlin e K-означава b ecause на своята простота; Въпреки това по време на нашия дизайн ние също изпитват други metho ds, включително плътност базирани и йерархични данни поток клъстериране алгоритми (например, DenStream [10] и LiarTree. Въпреки че пълно показател и настройка на тези алтернативни методи е извън обхвата на нашия анализ, ние събрани доказателства за лекотата на разширяване на нашата рамка на различни алгоритми.
В бъдеще може да се разпростре на набор от функции, включени от нашите клъстериране рамка, имайки предвид например образувания като изображения. Освен това нашите предварителен анализ показва, че въвеждането на динамични редове като функции, може да даде значителни подобрения. Нашите дългосрочен план е да се интегрират на meme клъстериране рамка с meme класификатор да разграничи инженерство видове социални медии съобщение от спонтанни такива. Тази платформа ще приеме контролирано обучение техники, за да класифицира memes и определяне на тяхната легитимност, с цел да се открие кампании за дезинформация и измама в техните ранни фази. Платформата ще бъде оптимизирана за работа с недвижим имот, висок том потоци от съобщения, типични за Twitter и други онлайн социални медии.