برای تجربه بهتر در این وبسایت، لطفا از صفحه نمایش بزرگتر استفاده کنید.
به نقل از زومیت؛ دیجیکالا چندی پیش با انتشار خبری اعلام کرد که تأیید و رد کامنتهای ثبتشده توسط کاربران را به هوش مصنوعی سپرده است. در این رابطه به گفتوگو با مدیر تیم هوش مصنوعی و محتوای دیجیکالا نشستیم تا از روند توسعهی این سیستم آگاه شویم.
اواخر آبانماه سال جاری دیجیکالا با انتشار خبری اعلام کرد که بخش اعظم مدیریت بخش کامنتها در این فروشگاه به هوش مصنوعی سپرده شده است. برای آگاهی از کم و کیف این سیستم به گفتوگو با مدیران دیجیکالا نشستیم. در این گفتوگو، وحید پولادی، مدیر بخش محتوای دیجیکالا و نوید شهدی، مدیر بخش هوش مصنوعی، به ارائه اطلاعاتی در رابطه با این سیستم پرداختند.
امیرحسن موسوی، مدیر روابط دیجیکالا، در ابتدای گفتوگو اعلام کرد که برای توسعهی این سیستم دو تیم محتوا و هوش مصنوعی درگیر بودهاند. البته به گفتهی موسوی، پیش از تشکیل تیم هوش مصنوعی، یکی از استارتاپهای حاضر در دیجی نکست در این فرایند شرکت داشته که در ادامهی ماجرا با تشکیل تیم هوش مصنوعی دیجیکالا به مدیریت نوید شهدی، فرایند توسعه به تیم هوش مصنوعی دیجیکالا سپرده شده است.
– کامنت کاربران چه جایگاهی در ساختار محتوای دیجیکالا دارد؟
– وحید پولادی: فرایند مدیریت محتوا در دیجیکالا پس از گذشت ۱۵ سال از تأسیس این فروشگاه اینترنتی، سومین نسل خود را پشت سر میگذارد و با توجه به افزایش تنوع کالاها، دیگر استراتژی تولید محتوا بهصورت متمرکز پاسخگو نیست و از اینرو کامنت کاربران برای کالاهای مختلف نقش بسیار پررنگتری به خود گرفته است. با افزایش تنوع کالایی، تولید محتوا باید با مشارکت کاربران و از طریق کامنتها انجام شود. تغییر استراتژی محتوایی دیجیکالا باعث شد رویهای برای تشویق کاربران به منظور کامنت گذاشتن در پیش گرفته شود و در نتیجه تعداد کامنتهای ثبتشده افزایش یافت؛ بهطوریکه در حال حاضر کاربران دیجیکالا بهصورت روزانه میانگین بیش از ۴۰ هزار کامنت (رکورد بیش از ۶۰ هزار کامنت در یک روز) در این فروشگاه ثبت میکنند. با پیادهسازی امکان ضمیمه کردن تصاویر و ویدئو در کامنت، به این نتیجه رسیدیم که مدیریت این بخش وظیفهی بسیار سنگینی به تیم محتوا تحمیل میکند؛ برای مثال تعداد کامنتها طی یک ماه اخیر بیش از ۵۰ درصد افزایش یافته است. اول با یک استارتاپ که در دیجی نکست فعال بود، در خصوص این موضوع وارد مذاکره شدیم؛ اما پس از گذشت مدتی متوجه شدیم راهکار این استارتاپ قابلیت پیادهسازی در سیستم دیجیکالا ندارد. همزمان با اینها، نوید شهدی وارد دیجیکالا شد.
– توسعه سیستم هوش مصنوعی چندماه طول کشید و پیشرفت این سیستم چطور بوده است؟
– نوید شهدی: من ابتدای امسال به دیجیکالا اضافه شدم و مدیریت تیم هوش مصنوعی را بر عهده گرفتم. پس از تشکیل تیم هوش مصنوعی، ما با تیمهای متعدد فعال در دیجیکالا به صحبت نشستیم تا چالشها و گلوگاههایی که میشد با راهکارهای مبتنی بر هوش مصنوعی حل کنیم، شناسایی کنیم. موضوع مدیریت کامنتها از جمله چیزهایی بود که انرژی زیادی از تیم محتوا میگرفت و توسعهی یک الگوریتم مبتنی بر یادگیری ماشین میتوانست بار این کار را سبکتر کند.
اوایل سال جاری و پس از توافق برای پیادهسازی این سیستم، یکی دو ماه مذاکره برای مشخص کردن قوانین صرف کردیم و سه ماه طول کشید تا دیتای لازم جمعآوری شود. تیم محتوا کار خود را آغاز کرد؛ بهطوریکه تمام دادهها بالغ بر یک میلیون و هشتصدهزار کامنت با لیبل گردآوری شد. اوایل مهرماه ۱۳۹۹ این سیستم تأیید خودکار استفاده شد.
البته پیش از توسعهی سیستم جدید، یک الگوریتم دیگر استفاده میشد که فقط قادر بود دربارهی رد کردن کامنتها اظهارنظر کند. البته این سیستم تنها قادر به رد کردن ۲ درصد کامنتها بوده است. قطعا افزایش تعداد کامنتها باعث شد این سیستم عملکرد چندان مثبتی نداشته باشد؛ در حالی که درصد موففیت الگوریتم هوش مصنوعی جدید برای رد، تأیید یا شناسایی بهعنوان کامنتی که باید عامل انسانی دربارهی آن نظر دهد، بیش از ۹۸ درصد است.
توسعه، فرایند یادگیری ماشین و آزمون این سیستم حدود ۶ ماه زمان برد و در حال حاضر ۷۵ تا ۸۰ درصد از کامنتهای ثبتشده توسط سیستم هوش مصنوعی مدیریت میشود.
– آیا هوش مصنوعی موفق شده است برداشت سلیقهای عامل انسانی در قوانین تأیید یا رد نظرات را برطرف کند؟
– نوید شهدی: با توجه به برداشت سلیقهای عوامل انسانی از قوانین تعیینشده برای رد یا قبول کردن کامنتها، این موضوع با اضافه شدن ماشین و هوش مصنوعی از بین رفته است؛ البته این مشکل خیلی محدود بود و تناقض عملکرد در رد یا تأیید کامنتها چندان پررنگ نبود.
– اغلب چه کامنتهایی منتشر نمیشوند؟
– وحید پولادی: کامنتها بهعنوان بخشی از محتوای دیجیکالا در نظر گرفته میشوند و از اینرو بسیار ارزشمند هستند. اما برخی کامنتها ارتباطی با آن کالا ندارند و بیشتر به تشریح تجربهی خرید میپردازند که از اینرو منتشر نمیشوند. برای مثال به کامنتهایی در رابطه با شکایت از دیر رسیدن کالا اشاره کرد که ارتباطی با خود کالا ندارد. البته منتشر نشدن کامنتها در خصوص مشکلات اینچنینی به منزلهی نادیده گرفته شدن آنها نیست؛ این نوع کامنتها هرچند در صفحهی فوق منتشر نمیشوند، اما پیام کاربر در قالب یک مسأله درونسازمانی برای پیگیری به واحدهای مربوط ارسال میشود. در فاز بعدی هم تلاش بر این است تا تشخیص این کامنتها توسط هوش مصنوعی انجام شود.
– پردازش طبیعی زبانها، دیتای جالبی جز تأیید و رد نظرات در اختیار قرار میدهد؛ آیا برنامهای برای گسترش استفاده از قابلیتهای هوش مصنوعی و اطلاعات استخراجشده وجود دارد؟
– نوید شهدی: تأیید یا رد کامنتها را باید بخش کوچکی از سیستم هوش مصنوعی مرتبط با کامنتها عنوان کرد که در دست توسعه داریم. اطلاعاتی که کاربران در قالب کامنتهای برای محصولات مختلف ثبت میکنند، در زمینههای بسیاری قابل استفاده است. برای مثال با استفاده از کامنت ثبتشده برای یک محصول، میتوان نقطهی قوت و ضعف محصول را استخراج کرد و همچنین توصیه برای خرید یا نخریدن محصول را بر اساس منظور کاربر از کامنت استنباط کرد. اطلاعات برگرفته از کاربران در قالب کامنتها را که اتفاقا حجم بالایی هم دارند، میتوان در انواع سناریوهای مختلف استفاده کرد که از جملهی این کاربردها میتوان به بخش نظرات، بخش پیشنهاد به کاربران دیگر و رتبهبندی محصولات استفاده کرد.
– وحید پولادی: استفاده از هوش مصنوعی علاوه بر اینکه بار عملیاتی کنترل کامنتها را کم میکند، در آینده باعث خواهد شد بتوان معنای کامنتهای ثبتشده را استخراج کرد. برای مثال دربارهی یک گوشی هوشمند، احتمالا کامنتهایی دربارهی ماژولهای مختلف نظیر باتری، دوربین و سایر چیزها با نقد عملکرد هر یک از این ماژولها شامل موارد نکات مثبت و منفی ثبت شده است. هوش مصنوعی پس از تصمیمگیری دربارهی انتشار یا رد شدن کامنت، میتواند توصیه برای خریدن یا نخریدن محصول را بر اساس معنای هر یک از کامنتها بهصورت خلاصه به کاربران نمایش دهد. کاربرد دیگری که برای این سیستم در نظر گرفته شده، جلوگیری از انتشار کامنتهای غیر واقعی است.
– قیمت بالا و وجود کالاهای غیر اصل از جمله انتقادات واردشده به دیجیکالا است؛ آیا برنامهای برای هوش مصنوعی به منظور شناسایی چنین چیزهایی دارید؟ آیا سیستم گزارشدهی کامنتها میتواند در اینباره کمک کند؟
– وحید پولادی: برای درک اینکه چطور یک کالای غیر اصل در همان ابتدا شناسایی نمیشود، بهتر است ابتدا نگاهی به فرایند ثبت یک کالا در دیجیکالا داشته باشیم. سیستم دیجیکالا به نوعی طراحی شده است که امکان ثبت کالای مشابه در آن وجود ندارد. برای مثال در صورتی که یک ساعت اورجینال توسط یک فروشنده در حال فروش باشد، دیجیکالا اجازه نمیدهد تأمینکنندهای دیگر این محصول را با ایجاد یک صفحهی محصول جدید عرضه کند. حال فرض کنید که تأمینکنندهی دوم، نسخهی غیر اصل این کالا را برای فروش قرار داده است و از اینرو هر دو کالا از طریق یک صفحه محصول با تأمینکنندگان مختلف به فروش میرسند. در این شرایط وقتی کاربری کامنتی دربارهی غیر اصل (فیک) بودن کالا منتشر میکند، بلافاصله موضوع به بخش مانیتورینگ مارکتپلیس گزارش میشود و این بخش از تأمینکننده درخواست میکند مدارک خود دال بر اصل بودن کالا را ارسال کند. در صورتی که تأمینکننده قادر به اثبات ادعای خود مبنی بر اصل بودن کالا نباشد، دیجیکالا کالای این تأمینکننده را حذف میکند. پس استفاده از هوش مصنوعی فقط به شناسایی کامنتها در این رابطه محدود میشود.
– نوید شهدی: پروژهای طولانیمدت تعریف شده است که در نظر داریم با استفاده از فاکتورهای مختلفی نظیر قیمت محصولات در بازار آفلاین، ارزش دلار و سایر پارامترهای دخیل، به برآورد قیمت کالاها بپردازیم. کامنت در مقطع فعلی نمیتواند نقش مؤثری برای محاسبه قیمت داشته باشند؛ هرچند میتوان با استفاده از کامنتها فهمید نظر کاربران در رابطه با قیمت چیست.
– با توجه به تغییر استراتژی محتوایی دیجیکالا دربارهی بخش کامنت، چه برنامهایهایی برای این بخش دارید؟
– وحید پولادی: ما در نظر داریم روند کامنتگذاری را به سمت محتوای ویدیویی سوق دهیم و در جریان این تغییر و تحول، به کاربرانمان هم آموزش دهیم تا بتوانند ویدیوهایی باکیفیت تولید کنند. برای مثال کاربران میتوانند برای کالاهای مختلف ویدیوی جعبهگشایی تولید و در صفحهی محصول آپلود کنند و حتی در آینده قادر خواهند بود از این ویدیوها درآمدزایی کنند.
این مطلب اولین بار در زومیت منتشر شده و در اتاق خبر دیجیکالا بازنشر شده است.