الگوریتم جدید یادگیری ماشین برای تخمین سن و جنسیت از روی اطلاعات توییتر

توییتر

یک ابزار «جمعیت‌شناسی استنتاجی» با استفاده از الگوریتم جدید یادگیری ماشین که توسط جمعی از محققان و اساتید دانشگاه طراحی شده می تواند تنها بر اساس اطلاعات نام، بیوگرافی و عکس پروفایل افراد در شبکه های اجتماعی نتیجه‌گیری‌هایی در مورد آن‌ها انجام دهد.

این سیستم جدید یادگیری ماشین که در کنفرانس وب سانفرانسیسکو رونمایی شد، توسط محققین دانشگاه‌های آکسفورد، میشیگان، ماساچوست، انستیتو ماکس پلانک و دانشگاه استنفورد طراحی شده و الگوهای مرتبط با سن و جنسیت های مختلف را از بیش از 4 میلیون اکانت حقیقی و حقوقی با 32 زبان دریافت می‌کند. سپس این اطلاعات با موقعیت مکانی تخمینی تلفیق شده و در مقابل داده‌های سرشماری بازبینی می‌شود تا اطلاعات دقیق‌تری از جمعیت در 1101 ناحیه اروپا به دست آید.

این الگوریتم راه را برای اطلاع از نظرات مردم درباره موضوعات مهم اجتماعی با استفاده از آنالیز فعالیتشان در شبکه‌های اجتماعی هموار می کند و می‌توان بازخورد دقیق‌تری از دیدگاه‌های اقشار مختلف در موقعیت‌های جغرافیایی و گروه‌های جمعیت‌شناسی گوناگون داشت.

دکتر اسکات هیل محقق ارشد پروژه از دانشگاه آکسفورد در این‌باره گفت:

برخلاف داده‌های زیادی که شبکه‌های اجتماعی در اختیار قرار می‌دهند، این پلتفرم‌ها ابزار مطمئنی برای فهم موضوعات مهم در دیدگاه عامه مردم نیستند چرا که هر شخص خودش انتخاب می‌کند از کدام پلتفرم استفاده کند.

این تحقیق که در نوع خود اولین است، در مورد کاربران شبکه‌های اجتماعی، پیش‌بینی‌های جمعیت‌شناسی انجام می دهد و این کار را فقط از طریق مشخصات صاحب حساب و مقایسه آن با داده‌ سرشماری‌های واقعی به انجام می‌رساند.

ما این روش را به عنوان یک قدم مهم برای درک موضوعات مردمی مهم و مشکلات اجتماعی تلقی می‌کنیم که با استفاده از آن می‌توان تشخیص داد کدام یک از این مسائل و مشکلات توسط گروه‌های مختلف مورد توجه قرار گرفته‌اند.

منبع: دیجیاتو