loading...
تبدیل گفتار به متن
محمد بازدید : 271 شنبه 13 دی 1399 نظرات (0)

تا بحال بارها راجع به فناوری تبدیل گفتار به نوشتار و کاربردهای آن در مقالات مختلف صحبت کرده ایم و در مورد دستیارهای صوتی که از فناوری تبدیل گفتار به نوشتار نیز در آن ها استفاده می شوند و لزوم استفاده از آن ها در اپلیکیشن ها نیز صحبت کردیم. اما امروز به طور اختصاصی  می خواهیم به این مسئله بپردازیم که فناوری تبدیل گفتار به نوشتار چگونه کار می کند و چطور یک ماشین می تواند صوت گفتاری را به نوشتار آن تبدیل کند.

تبدیل گفتار به نوشتار چیست؟

فناوری تبدیل گفتار به نوشتار در حقیقت زیر مجموعه ای از فناوری پردازش یا بازشناسی گفتار یا speech recognition  می باشد که می تواند صوتی که وجود دارد را (اعم از صحبت های افراد، صوت ضبط شده، صدای یک فیلم و…) به نوشتار تبدیل کند یا به عبارتی گفتار را تبدیل به نوشتار نماید.

فناوری تبدیل گفتار به نوشتار در حقیقت نوعی برنامه، اپلیکیشن، نرم افزار و… می باشد که محتوای صوتی را گرفته و با پردازش محتوای آن صوت، آن را به کلمات مکتوب تبدیل می نماید. فناوری تبدیل گفتار به نوشتار، همان طور که گفته شد یک فناوری بر پایه هوش مصنوعی می باشد که قادر است از یک گفت و گوی شفاهی و محتوای صوتی موجود، محتوای متنی تهیه کند و یا اینکه به صورت تایپ در لحظه به کار رود.

تبدیل گفتار به نوشتار چگونه کار می کند؟

تبدیل گفتار به نوشتار بخشی از فناوری بازشناسی گفتار می باشد که به سادگی میتوان مسئله بازشناسی گفتار را در این فرمول احتمالاتی شرطی خلاصه کرد:

فرمول احتمال شرطی برای تبدیل گفتار به نوشتار

به این معنی که ما به دنبال رشته‌ای از کلمات خروجی هستیم که با توجه به سیگنال ورودی موجود، محتمل‌ترین رشته کلمات خروجی را به ما نشان دهند. مسئله را می توان بر اساس این فرمول باز کرد و گفت که احتمال سیگنال، نسبت به رشته کلمات مورد نظر ضرب در احتمال کلمات. زمانی که این دو را باز کنیم، در واقع دو پایه اساسی یک سیستم بازشناسی گفتار به دست می آید که عبارتند از:
1.مدل آکوستیکی
2.مدل زبانی
کار مدل آکوستیکی آن است که تشخیص می دهد با توجه به سیگنال ورودی محتمل ترین آواهای خروجی چه چیزهایی هستند. کار مدل زبانی هم آن است که تشخیص دهد پس از ترکیب آواها، محتمل ترین کلماتی که در آن زبان می توانیم پشت سرهم داشته باشیم، چه هستند. این فرمول شاید ساده ترین و پایه‌ای ترین فرمول بازشناسایی گفتار باشد. در ساختار کلی یک سیستم بازشناسایی گفتار همه چیز از سیگنال صوتی شروع می شود.

سیگنال صوتی وارد یک سری پیش پردازش ها می شود. به عنوان مثال در زمانهایی که سکوت داریم، سیگنال صوتی را می بُریم یا نویز را کاهش می دهیم، استخراج ویژگی ها نیز بخشی از پیش پردازش می باشد. پس از اتمام پیش پردازش، سیگنال صوتی با یک سری ویژگی های کلی بدست می‌آید. در نهایت با ترکیب دو مدل زبانی و آکوستیکی، سیگنال یا ویژگی ها را به کلمات نهایی رمز گشایی (Decode) می کنیم.

ساختار سیستم های بازشناسایی گفتار

روش های بازشناسایی گفتار

به صورت کلی تلاشها یا روشهایی که در زمینه پردازش گفتار شده را میتوان به 3 مقطع زمانی تقسیم کرد:

3 مدل بازشناسی گفتار

مدل گاوسین-مدل مخفی مارکف

مدلهای مخلوط گاوسین-مدل مخفی مارکف که به Gmm-Hmm نیز معروف می باشند،تا حدود 25 سال پیش بدون هیچ رقیب دیگری برای بازشنایایی گفتار استفاده می شدند تا زمانی که در مقاله معروف  سال 2006 که توسط یکی از افراد یسیار مهم در زمینه deep learning یعنی دکتر هینگتون ارائه شد، شبکه های عصبی باور عمیق یا DBN ها جایگزین مدل مخلوط گاوسین شدند. اما با این حال باز هم از مدل مخفی مارکف برای شبیه سازی زمانی استفاده می‌کردیم. در نهایت، طی سالهای اخیر مدل سرتاسری شبکه‌های عمیق بازگشتی معرفی شدند که دو مدل قبلی را باهم ترکیب کرده و در یک شبکه عمیق به کار می بردند.

شماتیک کلی این مدل ها را در می توانیم در تصویر زیر مشاهده کنیم. برای توضیح مختصر تصویر می توانیم بگوییم که ما در این مدل از سیگنال های صوتی که داریم یکسری ویژگی استخراج می کنیم. این ویژگی ها میتوانند expectogram یا nfcc باشند. با کمک مدل مخلوط گاوسین، یک آکوستیک مدلی را درست می کنیم و سپس از خروجی همان آکوستیک مدل، یا در واقع از آواهایی که بدست آمده در یک شبکه HMM، از آواهایی که وجود داشتندمدلسازی زمانی انجام می دهیم و در نهایت به متن می‌رسیم.

مدل مخلوط گاوسین-مارکف در بازشناسی گفتار

ساختار مدل شبکه عصبی باور عمیق-مدل مخفی مارکف

در شبکه های باور عمیق نیز همان اتفاق می افتد. ما میتوانیم expectogram و یا حتی ورودی خام سیگنال صوتی و MCC را داشته باشیم.تنها تفاوت آن با مدل قبلی آن است که بجای مدل گاوسین، از یک شبکه باور عمیق استفاده می کنیم.
تا قبل 2006 امکان اموزش شبکه های بزرگ وجود نداشت، در آن زمان همه ی افراد فعال در حوزه هوش مصنوعی می دانستند که با افزایش تعداد لایه‌ها قاعدتا می توانیم نتایج بهتری بگیریم و به اصطلاح به درک بالاتری از آن ورودی می رسیم. یعنی هرچه تعداد لایه ها زیادتر و عمیق تر باشد ما میتوانیم در عمق بیشتر درک بهتری از ورودی پیدا کنیم. اما امکان اموزش این شبکه ها به دو دلیل وجود نداشته‌است: اولین دلیل اینکه برای انجام این کار الگوریتمی وجود نداشته است و تا آن زمان ما تنها می توانستیم شبکه های 2 تا 3 لایه را آموزش دهیم.زمانی که عمق شبکه ها بیشتر می شد نیز از روش نشر بازگشتی استفاده می کردیم که توانایی انجام درست این کار را نداشت.
با این حال در سال 2006 الگوریتمی درست شد که با کمک آن می توانستند لایه ها را تک تک آموزش بدهند و سپس این لایه ها را بر روی هم سوار کردند و در نهایت به شبکه یک آموزش کلی داده شد. بعد از این اتفاق امکان آن به وجود آمد که به عنوان مثال بتوانیم 6 تا 7 لایه از شبکه های عصبی را با دقت خوبی آموزش دهیم. با آمدن این الگوریتم جای مدل مخلوط گاوسین یا GMM ها با شبکه های باور عمیق یا DBM تغییر کرد، اما ما همچنان از HMM ها یا مدل مارکف برای شبیه سازی مدل های زمانی استفاده می کردیم.

مدل شبکه عمیق-مارکف در پردازش گفتار

ساختار سرتا سری شبکه های عمیق بازگشتی

یکی از ساختارهای معروف شبکه های عمیق بازگشتی ساختاری همانند تصویر زیر دارد که متعلق به مقاله معروفی است که چند سال پیش توسط “بایدو” منتشر کرد. باتوجه به تصویری که در زیر مشاهده می کنید مرزهای قبلی را بین دو مدل مختلف قبلی نداریم و تمام این اتفاقات در شبکه سرتاسری می افتند، باز هم در اینجا ما expectogram یا ورودی و سپس یک شبکه عمیق بازگشتی را داریم. در واقع هم آواها (مدل آگوستیکی) را داریم و در واقع مدل آکوستیکی را آموزش میبینم و همزمان شبیه سازی زمانی را نیز انجام میدهیم.

شبکه سرتاسری عمیق در پردازش گفتار

بازشناسایی گفتار با روش های یادگیری عمیق

در این روش ما در واقع می خواهیم تمام مراحل قبلی که گفته شد را با یک شبکه جایگزین کنیم، یعنی سیگنال ورودی داخل یک شبکه ای شود و در نهایت خروجی آن سیگنال را به صورت متن داشته باشیم، بدون اینکه نیاز باشد آن سیگنال را به مدل های مختلف بشکانیم و استخراج ویژگی کنیم و… و در واقع می خواهیم یک شبکه سرتاسری در میانه داشته باشیم.

یادگیری عمیق در پردازش گفتار

فارس آوا، نرم افزاری که گفتار را به نوشتار تبدیل می کند

در حال حاضر در کشور نرم افزاری برای تبدیل گفتار به نوشتار وجود دارد که به کمک روش هایی که در بالا گفته شد،گفتار را به متن تبدیل می کند. فارس آوا دارای بزرگترین دیتاست فارسی در داخل کشور می باشد که شامل 10 هزار ساعت دیتای زبان فارسی می باشد.  فارس آوا عملیات بازشناسایی گفتار را به کمک روش های یادگیری عمیق انجام می دهد و این نرم افزار تبدیل گفتار به متن در زبان فارسی امکان ارتباط کلامی انسان با کامپیوتر و یا موبایل را فراهم می کند. این نرم افزار با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهره گیری از آخرین تکنولوژی های روز دنیا تولید شده است و به دلیل جمع آوری بزرگ ترین دیتاست موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهره مندی از تنوع گفتاری بسیار وسیع موفق شده تا در رقابت با شرکت های بزرگی چون گوگل ضریب دقت بالایی داشته باشد.

تبدیل گفتار به نوشتار فارس آوا

ویژگی ها و قابلیت های فارس آوا عبارتند از:

  • تبدیل گفتار به متن فارسی با دقت و سرعت بالا
  • بهره مندی از آخرین تکنولوژیهای یادگیری عمیق
  • تبدیل گفتار به متن بصورت همزمان (Real-Time)
  • تشخیص گفتار و صوت در محیط های نویزی
  • پشتیبانی از انواع لهجه ها و گویش ها
  • قابلیت تبدیل گفتار محاوره ای به متن
  • پشتیبانی از انواع فرمتهای صوتی و ویدیویی
  • تبدیل گفتار انگلیسی به متن انگلیسی
  • غیر وابسته به گوینده و عدم نیاز به آموزش برای هر فرد
  • توسعه و تولید بصورت کاملاً بومی در داخل کشور
  • ارائه API و SDK تبدیل گفتار به متن در قالب وب سرویس
  • ارائه پنل تحت وب برای آپلود کردن فایلها جهت پردازش
  • قابل نصب روی سرور مشتری و عدم نیاز اتصال به اینترنت
  • بهره مندی از دایره واژگان (فرهنگ لغت) بسیار وسیع

همه ی مواردی که گفته شد باعث شده تا فارس آوا به یکی از کاربردی ترین و با کیفیت ترین محصولات موجود در بازار امروز ایران، تبدیل شود. فارس آوا نرم افزاری است که به صورت اختصاصی برای زبان فارسی تولید شده است و واژگان زبان فارسی را به خوبی درک و پردازش می کند. شما می توانید با خیالی آسوده از نرم افزار فارس آوا استفاده کنید و راندمان و بهره وری کار خود و یا کارمندان در سازمان و یا کسب و کارتان را افزایش دهید. علاوه بر این ها فارس آوا از رابط کاربری بسیار ساده ای برخوردار است که این امر استفاده همه ی افراد از این نرم افزار را بسیار ساده می کند.

برای خرید محصول فارس آوا و یا درخواست دمو محصول به اینجا مراجعه کنید.

 

 

http://mediajx.com/story9389651/گفتار-به-نوشتار


http://bookmark-dofollow.com/story8349854/گفتار-به-نوشتار


http://bookmark-template.com/story8351110/گفتار-به-نوشتار


http://prbookmarkingwebsites.com/story6435669/گفتار-به-نوشتار


http://socialmediainuk.com/story6922078/گفتار-به-نوشتار


http://gorillasocialwork.com/story7160798/گفتار-به-نوشتار


http://ztndz.com/story8688685/گفتار-به-نوشتار


http://opensocialfactory.com/story6015080/گفتار-به-نوشتار


http://socialrus.com/story6493100/گفتار-به-نوشتار


http://dirstop.com/story7177830/گفتار-به-نوشتار


http://bookmarkport.com/story7022496/گفتار-به-نوشتار


http://socialmediastore.net/story6994976/گفتار-به-نوشتار


http://bookmarkbirth.com/story6866075/گفتار-به-نوشتار


http://socialnetworkadsinfo.com/story7078524/گفتار-به-نوشتار


http://bookmarkloves.com/story7083500/گفتار-به-نوشتار


http://bookmarkstumble.com/story2388744/گفتار-به-نوشتار


http://bookmarkstime.com/story7956629/گفتار-به-نوشتار


http://gatherbookmarks.com/story8064592/گفتار-به-نوشتار


http://getsocialpr.com/story7117082/گفتار-به-نوشتار


http://bookmarkswing.com/story8971685/گفتار-به-نوشتار


http://bookmarkextent.com/story8992987/گفتار-به-نوشتار


http://bookmarksknot.com/story9021872/گفتار-به-نوشتار


http://bookmarkspring.com/story2431536/گفتار-به-نوشتار


http://bookmarkja.com/story8998342/گفتار-به-نوشتار


http://altbookmark.com/story9011171/گفتار-به-نوشتار


http://letusbookmark.com/story8835387/گفتار-به-نوشتار


http://trackbookmark.com/story8802889/گفتار-به-نوشتار


http://nybookmark.com/story8074500/گفتار-به-نوشتار


http://hindibookmark.com/story8900001/گفتار-به-نوشتار


http://bookmarkshq.com/story8857750/گفتار-به-نوشتار


http://bookmarketmaven.com/story8064038/گفتار-به-نوشتار

 

http://bookmarkrange.com/story8862445/گفتار-به-نوشتار

محمد بازدید : 65 دوشنبه 24 شهریور 1399 نظرات (0)
مزایای استفاده از هوش مصنوعی (AI) برای خودکارسازی روتوش تصاویر

یک تکنیک کمی معمولی می‌تواند چهره انسان و یا هر سوژه دیگری را در صحنه تغییر دهد. در نرم‌افزار ویرایش عکس یکی از سخت‌ترین بخش‌ها روتوش آن‌ها است. یک ویژگی هوش مصنوعی به نام “انتخاب شیء (subject)” در حال حاضر در Adobe included گنجانده شده ‌است. استفاده از این روتوش برای افراد بی تجربه هم بسیار ساده است. هوش مصنوعی امکان “انتخاب ناحیه و پوشش شیء” را فراهم می‌کند. به کمک این فناوری شما می‌توانید هر جای تصویر را که می‌خواهید انتخاب کنید و با کلیک کردن بر روی آن ناحیه، عملیات روتوش را انجام دهید.

هوش مصنوعی در همه زمینه‌ها بهترین است

در سال 2018، Photoshop CC نسخه 19.1 به روز شده Adobe Photoshop را برای استفاده در سیستم عامل‌های Windows و Mac معرفی کرد. در این نسخه هوش مصنوعی این امکان را فراهم کرده است تا تنها با یک کلیک بتوانید تمام ناحیه مورد نظر خود را انتخاب کنید.

برای کاربران ویندوز، این ویژگی شامل اضافه کردن یک اسلایدر Decontamination به فضای کاری select & Mask و به روز رسانی‌های سازگار قابل‌توجهی است. در نوامبر گذشته اولین دمو این ابزار توسط شرکت Adobe Sensei Al منتشر شد. توجه تیم فتوشاپ را به خود جلب کرد. با این ابزار، کاربران تنها با یک کلیک می‌توانند شی مورد نظر را انتخاب کنند.

انتخاب بخشی از یک تصویر امری معمول است. در طی این سال ها بر بهبود آن کار شده است. انتخاب یک ناحیه در فتوشاپ بخش مهمی از ویرایش تصویر است. این ویژگی به شما کمک می‌کند که سریعتر از قبل کار خود را شروع کنید. یادگیری ماشین و هوش مصنوعی به تشخیص اشیا و ناحیه‌ها در تصویر کمک می‌کند.

مزایای هوش مصنوعی

برای مانیتورهای با قدرت پردازش بالا در تصویر، کاربران ویندوز تلاش می‌کنند که بین تصاویر با رزولوشن‌های متفاوت و اندازه‌های متفاوت سوئیچ کنند. در تیم فتوشاپ یکی از دانشمند به نام جری هریس، سهم بسزایی در روند نوظهور علوم شناختی دارد. در نرم‌افزار فتوشاپ اندازه و زیبایی مظرح نیست. تراکم در صفحه مانتیور هم مهم نیست. در هر صورت این نسخه مفید است. این نسخه از فتوشاپ رابطه کاری تنگاتنگی با مایکروسافت دارد و فاکتورها را منطبق با استانداردهای مایکروسافت تنظیم می‌کند.

سخن آخر

به طور خلاصه، هوش مصنوعی در نرم‌افزارهایی مانند فوتوشاپ ساده‌ترین راه را برای کاربرانی که به روتوش تصویر تسلط چندانی ندارند، فراهم کرده است. هوش مصنوعی در این عرصه بسیار خوب عمل کرده، اما توجه داشته باشید که هنوز به کیفیت انجام دستی این کار نرسیده است و قابل رقابت با آن نمی‌باشد.

محمد بازدید : 47 چهارشنبه 19 شهریور 1399 نظرات (0)
مايکروسافت: انگليس بايد مهارت هاي هوش مصنوعي خود را افزايش داده يا خطر سقوط را بپذيرد!

مايکروسافت: انگليس بايد مهارت هاي هوش مصنوعي خود را افزايش داده يا خطر سقوط را بپذيرد! اين روزها گزارشي از مايکروسافت منتشر شده‌است که به انگليس هشدار مي‌دهد که با شکاف‌هاي بزرگ و حساسي در زمينه هوش مصنوعي (AI) روبرو است و اگر نتواند اين چالش را به خوبي مديريت کند، احتمالاً بايد هزينه آسيب‌هاي حاصل از اين بي‌توجهي را بپردازد! اين تحقيقات که توسط شرکت Microsoft تحت عنوان هوش مصنوعي در انگليس انجام شده‌است، اين موضوع را از چند جنبه بررسي مي‌کند. مايکروسافت براي تهيه گزارش خود به صورت کامل، آن را از چند جهت و جنبه با کمک داده‌هاي 12 هزار نفر از 20 کشور جهان بررسي کرده‌است. اين داده‌ها، کمک مي‌کنند که عملکرد کشور انگليس در حوزه هوش مصنوعي به راحتي بررسي شود و قابل مقايسه با ساير کشورها باشد. طبق اين گزارش، ميزان خرابي و نقص در پروژه‌هاي هوش مصنوعي انگليس، نسبت به ساير کشورها بيشتر بوده‌است و اين موضوع به حيثيت اين کشور لطمه بزرگي خواهد زد. در اين زمينه شايد براي شما هم جالب باشد که بدانيد، 29 درصد شغل‌هاي ايجاد شده بواسطه پروژه‌هايي که توسط دولت انگليس سرمايه‌گذاري شده‌اند، در واقع بدون هيچ ارزش تجاري بوده‌اند، در حالي که ميانگين جهاني چنين پروژه‌هايي تنها 19 درصد است. شکاف و بحران هوش مصنوعي در انگليس، موضوعي ثابت شده! در مورد اين مشکل و معضل نکته جالب تري وجود دارد که آن، نظرات رهبران مشاغل هوش مصنوعي در اين کشور است که از دو سال پيش، چنين وضعيتي را پيش‌بيني مي کرند و معتقد بودند که بحران در صورتي که حل نشود، جدي تر خواهد شد. طبق نظرات متخصصان در اين زمينه، مشکل اصلي اين است که دولت انگليس، آماده‌سازي مهارتي، تخصصي و علمي لازم براي اين موضوع را جدي تصور نمي‌کند و براي آن سرمايه‌گذاري انجام نمي‌دهد! طبق داده‌هاي جمع‌آوري شده، فقط 17 درصد از کارمندان انگليسي فعال در اين حوزه، اطلاعات لازم و کامل را در اين زمينه دارا بوده‌اند. اين روزها که فناوري‌هايي مانند هوش مصنوعي و ابري در حال ادغام هستند و فرآيندهايي مانند پردازش کلمه و … را انجام مي‌دهند، ياد دادن مهارت‌هاي استفاده از چنين فناوري‌هايي براي شرکت‌هايي که کارمندان آن‌ها اطلاعات و مهارت‌هاي کافي ندارند، کاملاً ضروري به نظر مي‌رسد. اين موضوع مي‌تواند به کارمندان هر بخش کمک کند که بهترين تصميم‌گيري‌هاي لازم براي کار با اين فناوري‌ها را اتخاذ کنند و فرآيندهاي مربوط به هدفگذاري توسط مديران به خوبي مسير را طي نمايد. هرچقدر که بازار هوش مصنوعي در جهان و انگلستان گسترده‌تر مي‌شود، جنگي که ميان استعدادها و مهندسين اين شرکت‌ها درمي‌گيرد، شديدتر خواهد بود و تاوان بالاتري خواهد داشت. در اين جنگ تنها تسليهاتي که به درد شما مي‌خورد، علم و دانشي است که داريد و غير از اين موضوع هيچ چيز ديگري براي شما کاربرد نخواهد داشت. نظرات کارمندان شرکت‌هاي فعال در انگليس چيست؟ در حال حاضر تنها حدود يک سوم کارمندان انگليسي بر اين باورند که محل کار و شرکتشان قادر است که به اندازه کافي آن‌ها را براي آينده اي که در انتظار AI است، آماده کند. (ميانگين جهاني در اين زمينه 42 درصد کارمندان است!) در اين زمينه سيمون لامبرت، مدير ارشد يادگيري مايکروسافت انگلستان اظهار داشته‌است که موفق‌ترين سازمان‌ها و موسسات در اين زمينه، آن‌هايي خواهند بود که داراي مهارت‌هاي فني، فعاليت‌هاي فرهنگي و … هستند. نبوغ انساني که با کمک علم و دانش رشد مي‌کند، همان چيزي است که باعث ايجاد تفاوت‌هاي اساسي در زمينه هوش مصنوعي و بازار افراد فعال در اين زمينه مي‌شود. فرار مغزها و استعدادهاي هوش مصنوعي از انگلستان فرار مغزها و استعدادهاي هوش مصنوعي از انگلستان، مشکل ديگري است که کشور انگليس از آن رنج مي‌برد! در اين زمينه دانشگاه‌هاي معروفي مانند آکسفور و کمبريج (که جزو بهترين دانشگاه‌هاي اين کشور محسوب مي‌شوند)، آمار اسفناک و وحشتناکي از اين موضوع منتشر کرده‌اند که نشان مي‌دهد، استعدادهاي اين کشور در حال مهاجرت به آمريکا و دره سيليکون ولي هستند! جايي که در آن احساس مي‌کنند، توانايي پيشرفت و دريافت حقوق بسيار بالاتري نسبت به شرکت‌هاي انگليسي دارند. به عنوان مثال همين چندي پيش يکي از اساتيد ارشد امپريال کالج لندن موضوع جالبي را بيان کرد که در آن هميشه تعجب مي‌کرد که چرا يکي از دانشجويان او هيچ وقت در کلاس حاضر نمي‌شود، اما سالانه مبلغي در حدود 9 هزار و 250 پوند براي شرکت در کلاس‌ها پرداخت مي‌کند. پس از آن که استاد، دانشجوي خود را فراخواند اين موضوع را درک کرد که دانشجوي او به دليل کار در شرکت اپل (Apple) در کلاس‌ها شرکت نمي‌کرده‌است و اين شرکت به او حقوق 6 رقمي پرداخت مي‌کند. در اين زمينه برخي از شرکت‌هاي آمريکايي مانند مايکروسافت در حال بررسي و ارائه راهکارهايي به انگليس هستند که جلوي اين معضل و بحران را بگيرند. همان‌طور که احتمالاً خودتان هم حدس مي‌زنيد، اگر بحران و مشکل فرار مغزهاي هوش مصنوعي به درستي حل نشود، مي‌تواند باعث ايجاد بحراني در آينده اي نزديک براي UK (انگلستان) شود. مايکروسافت در حال حاضر چه برنامه اي براي حل اين مشکل دارد؟ دکتر کريس بيشوپ، مدير آزمايشگاه تحقيقات مايکروسافت در کمبريج در اين زمينه گفته‌است که ما در چند سال گذشته موضوع فرار مغزها و مشکلاتي که ممکن است، توسط اين صنعت ايجاد شود را بررسي کرده‌ايم و متوجه شده‌ايم که تنها استعدادهاي برتر دانشگاهي نيستند که اقدام به فرار مي‌کنند، بلکه اساتيد دانشگاهي که در حال کار بر روي پروژه‌هاي AI هستند با شرايطي روبرو شده‌اند که در آن هيج دانشجوي جوان و با استعدادي وجود ندارد که پذيراي دانش آن‌ها براي آماده‌سازي باشد. اين مسئله باعث بوجود آمدن نگراني‌هايي شده‌است که طبق تحقيقات باعث ايجاد يک نسل از مهندسين بدون استعداد شده‌است. طبق فعاليت‌هاي مايکروسافت در اين زمينه از سال 2018 برنامه اي براي آموزش مهندسين نسل بعدي که داراي قابليت‌هاي لازم باشند، شروع شده‌است که اين موضوع به معناي اين است که دانشگاه کمبريج بايد اقدام به پرداخت هزينه‌هايي به اين شرکت آمريکايي کند. شرکت مايکروسافت در اين زمينه به دانشگاه کمبريج اطمينان داده‌است که هيچ استعدادي توسط اين شرکت جذب نمي‌شود و آن‌ها به راحتي قادر هستند که پس از گذراندن دوره‌هاي آموزشي عملي خود در اين شرکت، وارد بازار کاري شوند که علاقه دارند. اين موضوع هم به نفع دانشگاه کمبريج، شرکت مايکروسافت و دانشجوياني است که در اين دانشگاه تحصيل مي‌کنند. در اين زمينه شما چه نظري داريد؟ آيا راهکاري هم وجود دارد که باعث شود، دانشجويان و استعدادهاي ايراني از کشور نروند؟ به نظر شما چه کاري مي‌توان انجام داد. شما در اين زمينه مي‌توانيد نظرات، سوالات و تجربيات خود را با ما و ديگر کساني که اين خبر را مطالعه مي‌کنند به اشتراک بگذاريد.

محمد بازدید : 147 دوشنبه 27 مرداد 1399 نظرات (0)
فورد در کارخانه‌های خود از سگ‌های رباتیک استفاده می‌کند

کارخانه فورد در میشیگان به سمت استفاده از سگ‌های رباتیک رفته است. جانوران چهار پا رباتیک در دوره جدیدی از طراحی رایانه و راندمان اقتصادی برای این کمپانی سازنده خودرو، طلیعه جدیدی هستند.

Fluffy and Spot

دو سگ به نام Fluffy و Spot که توسط شرکت Boston Dynamics ساخته شده اند. این شرکت در ساخت ربات رتبه برتر را دارد. وظایف این سگ‌های پیمایش کارخانه Van Dyke Transmission در استرلینگ هایتز، میشیگان و اسکن طرح‌ها به منظور کمک به مهندسان در تهیه طرح‌های کارآمدتر برای به روزرسانی پروژه‌ها و اتمام دوره پروژه خواهد بود.

امکانات سگ‌ها

هر سگ مجهز به پنج دوربین است که قابلیت اسکن 360 درجه را دارند. آن‌ها می‌توانند با سرعت حداکثر 3 مایل در ساعت حرکت کنند و از پله‌ها تا زاویه 30 درجه حرکت کنند. باتری آن‌ها تا حدودی کمتر از دو ساعت شارژ نگه می‌دارد.

Scouter

یک ربات قوی تر به نام، Scouter ، به عنوان راننده در کل کارخانه فعالیت می‌کند. این ربات اسکنر بزرگتر و حجیم‌تری دارد و به بسیاری از مناطقی که  Fluffy و Spot نمی‌توانند دسترسی داشته باشند، دسترسی دارد. بر اساس نتایج اولیه این دو حیوان-ربات مورد استقبال قرار گرفته‌اند. مارک گودریس، مدیر مهندسی دیجیتال در فورد، توضیح می‌دهد که چگونه سگ‌های رباتیک در مورد آنچه که سابقا یک کار اسکن طولانی و پرهزینه بود، پیشرفت کردند.

گودریس گفت: “ما قبلاً از سه پایه استفاده می‌کردیم و در محل کار در مکان‌های مختلف سه پایه را مستقر می‌کردیم. هر بار پنج دقیقه برای انجام عملیات صبر می‌کردیم”. اسکن یک کارخانه می‌تواند دو هفته طول بکشد. با کمک Fluffy، ما می‌توانیم این کار را در یک هفته انجام دهیم.”

گودریس گفت: این کارخانه تولیدی طی این سال‌ها دستخوش تغییرات و تعدیلاتی شده است که بسیاری از آن‌ها ثبت نشده اند.

مزایا

“با داشتن ربات اسکن کننده تجهیزات، می‌توانیم دقیق تر کارخانه را زیر نظر داشته باشیم. و یک مدل مهندسی جدید بسازیم. این مدل دیجیتالی هنگام استفاده مجدد کارخانه برای محصولات جدید استفاده می‌شود.” پروژه‌های اسکن معمولاً حدود 300000 دلار هزینه می‌خواهند. انتظار می رود Fluffy و Spot به کاهش قابل توجهی این رقم کمک کنند.

ربات‌ها را می توان مسافت‌هایی تا فاصله 164 فوت دورتر را اداره کنند. سرانجام، برنامه‌های کنترل از راه دور ایجاد شده که امکان کنترل از هر نقطه جهان را فراهم می‌کنند. سگ‌های رباتیک واقعاً نژاد نادری هستند! هزینه آن‌ها 75000 دلار بود فورد در حال حاضر این دو سگ را اجاره کرده است. Boston Dynamics  پسرخاله‌های Spot را به سایر نقاط جهان اعزام کرده است.

دیگر کاربردهای سگ‌های رباتیک

شرکت اکتشاف و توسعه نفت نروژی Aker BP ASA در نظر دارد از ظرفیت اسکن استریو Spot، برای سیستم‌های جلوگیری از مانع و حسگرهای پردازنده برای ردیابی نشت گاز و انتقال شرایط آب و هوایی از دریا استفاده کند. این عملیات می‌تواند در مکان‌هایی غیرقابل دستیابی توسط کارگران و در کارهایی که برای انسان بسیار خطرناک هستند انجام شود.

در مزرعه ای در نیوزیلند، از این ربات‌ها برای نظارت بر رشد محصولات زراعی و همچنین گوسفندان گله استفاده می شود. در بیمارستان بریگام و بیمارستان زنان در بوستون، یک سگ روباتیک با iPads ساخته شده است تا به پزشکان اجازه دهد از راه دور با بیماران مبتلا به COVID-19 ارتباط برقرار کنند و آن‌ها را معاینه کند.

“مارك رایبرت” بنیانگذار بوستون داینامیك در مصاحبه CNBC گفت: “در ابتدا، ما فقط از طریق این سگ‌ها با آن‌ها صحبت می‌كردیم بدون آنكه نیاز به وجود یك كارگر بهداشتی در آنجا باشیم. حالا ما اندازه گیری‌های علائم حیاتی مانند میزان تنفس، درجه حرارت بدن را به کمک این سگ‌ها انجام می‌دهیم. ما روی اکسیژن رسانی و ضربان قلب کار می‌کنیم. همه این کارها را به کمک این ربات انجام می‌دهیم.”

و در سنگاپور، از ربات‌ها برای نظارت بر شیوه‌های کنترل از راه دور اجتماعی در پارک‌های عمومی استفاده می‌شود. این باعث می‌شود پرسنل انسانی از قرار گرفتن در معرض خطر و در معرض ابتلا به بیماری از افراد آلوده حفظ شوند. این سگ‌ها همچنین می‌توانند پیام‌ها و هشدارهایی را به افراد یادآوری كنند تا آن‌ها بیشتر احتیاط کنند.

محمد بازدید : 53 چهارشنبه 22 مرداد 1399 نظرات (0)
هوش مصنوعي در موزيک و ايجاد ژانر جديد در اين صنعت

 

هوش مصنوعي در موزيک : ايجاد ژانر جديدي در صنعت موسيقي

هوش مصنوعي در موزيک و انقلابي که به کار گيري آن در اين صنعت به وجود آورده و به وجود خواهد آورد، موضوع امروز مقاله ماست. بي‌شک شما از آينده‌اي اين صنعت شگفت‌زده خواهيد شد. پس با عامر انديش همراه باشيد تا در مورد انقلابي AI در صنعت موسيقي بيشتر آشنا شويد.

هوش مصنوعي در موزيک

فضايي را تصور کنيد که در رخت‌خواب خود دراز کشيده‌ايد، درحالي‌که بيرون باران مي‌آيد و شما کتاب مورد علاقه خود را در آغوش گرفته و به موزيک دلخواهتان گوش فرا مي‌دهيد. اين احتمال وجود دارد که موسيقي که در حال گوش دادن به آن هستيد، توصيه برنامه پخش موسيقيتان باشد که دقيقا متناسب با حال و هواي بيرون و فعاليتي است (کتاب خواندن) که در حال انجام دادن آن هستيد.

در حالي‎که کمپانيهاي بزرگ فناوري موسيقي مانند Tencent از Joox، QQ Music، KKBox و غيره از گزاره‌هاي ارزشي متفاوتي مانند ارائه بي‌شمار موسيقي منطقه‌اي و يا مدل‌هاي مختلف کسب و کار ب حمايت مي کنند، اما به نظر مي‌رسد علي‌رغم تمام اين تفاوت‌ها، همگي آنان هدف مشابهي را دنبال مي‌کنند و آن چيزي نيست جز اعمال AI (هوش مصنوعي) در صنعت موسيقي.

اعمال هوش مصنوعي در موزيک

در سال‌هاي اخير، اهميت و محبوبيت AI در موسيقي جايگاه ويژه‌اي پيدا کرده است. استفاده وسيع از AI در هسته برنامه‌هاي پخش موسيقي به دلايلي وابسته است که برخي از آن‌ها بسيار روشن و واضح‌اند و برخي ديگر خير. اين دلايل به قرار زير هستند:

هوش مصنوعي در صنعت موسيقي باعث افزايش تجربه شنوندگان از طريق پلي‌ليست شخصي (Personalozed Playlist) مي‌شود:

در گذشته:

هر هنرمند شخصيت خود را از طريق موزيکش ارائه مي‌داد. به صورتي که برخي از مردمان عاشق طبيعت جاز لوييس آرمسترانگ شده بودند، برخي ديگر، هنگامي‌که الويس پريسلي يکي از آهنگ‌هاي عاشقانه خود را بيرون مي‌داد، از خود بي‌خود مي‌شدند، برخي نيز عاشق گوش دادن به آهنگ‌هاي راک گروه Beatlets با صداي بسيار بلند بودند و در نهايت عده‌اي ديگر نيز عاشق گوش فرادادن به گروه Doors بودند در حالي‌که به آرامي همراه با آهنگ‌ خود را به اين سو و آن سو حرکت مي‌دادند.

انقلاب هوش مصنوعي در موزيکانقلاب هوش مصنوعي در موزيک

شرايط کنوني:

کمپاني‌هاي اپليکيشن‌هاي پخش موسيقي مانند QQ، KuGou از هوش مصنوعي براي آناليز الويت‌هاي شنوندگان استفاده مي‌کنند و براساس آن و سليقه شخصي اين افراد، موسيقي‌هاي مورد علاقه‌شان را پيشنهاد مي‌کنند.

برنامه‌هاي پخش موسيقي با کمک (AI) و براساس موتورهاي توصيه‌کننده (recommendation engine) تاريخچه موسيقي‌هاي افراد براي دادن بهترين و دقيق‌ترين پيشنهاد، آناليز و تجزيه و تحليل مي‌کنند.

آينده:

درحالي‌که امروزه کاربرد AI در موسيقي، براي پيشنهاد نزديک‌ترين آهنگ مطابق با  سليقه شخصي افراد است، اما اين احتمال قوي وجود دارد که در آينده صنعت پخش موزيک با استفاده از AI سعي در ارائه موزيک بايومتريک و فيزيولوژيکي با استفاده از پارامترهايي مانند اندازه‌گيري ضربان قلب، ميزان سطح استرس، سيگنال‌هاي عصبي و غيره کند.

تصور کنيد که در يک مترو کاملا شلوغ هستيد. عجله ديگر افراد براي رسيدن به موقع به مقصدهاي خود باعث عصبي شدن شما مي‌شود. در اين حالت، وسيله‌ي ريز و نازکي در زير گوش‌ شما قرار داده شده، ميزان استرس و ناراحتي شما را اندازه مي‌گيرد و براساس آن موزيک ملايم و آرام‌بخشي از خواننده مورد علاقه‌تان پخش مي‌نمايد.

بازخورد اتوماتيک و خودکار اين دستگاه‌هاي هوشمند مشخص مي‌کند که چگونه يک موسيقي ملايم و آرام مي‌تواند در سلامت جسم و روانتان موثر واقع شود.

اين احتمال وجود دارد که AI در موسيقي قادر باشد تا با استفاده از ملودي آهنگ، ژانر آن، کيفيت تن موزيک، ريتم هارموني و غيره سلامت جسم و روان شما را تضمين کرده و منجر به بهبودي چشم‌گيري در سلامت روان شما شود.

در حقيقت اين رويکرد، مي‌تواند موج بعدي شخصي‌سازي موسيقي در AI به شمار آيد.

انقلاب هوش مصنوعي در موزيکانقلاب هوش مصنوعي در موزيک

هوش مصنوعي در موزيک يعني قدرت بي‌نهايت شما در انتخاب موسيقي مورد علاقه‌تان  :

در گذشته:

براي گوش دادن به موسيقي در خانه، شنودگان تنها مي‌توانستد ‌برچسب‌هاي ضبط شده واينال 12 اينچي را خريداري کنند که هر طرف آن قادر به پخش تنها 22 دقيقه موسيقي بود. واينال‌ها بسيار گران بودند. بنابراين شنوندگان تنها خوانندگان محلي و موسيقي سنتي خود را مي‌‌شناختند.

با تجاري ‎سازي گسترده راديو به منظور اهداف پخش رسانه‌اي، هنرمندان شروع به ضبط آهنگ‌هاي کوتاهتر 3 تا 7 دقيقه‌اي نمودند که به راحتي و از طريق راديو در دسترس همگان قرار مي‌گرفت.

پس از آن دوره‌اي از آلبوم‌هاي ضبط شده به صورت CD و DVD روانه بازار شد.

فراگير شدن اينترنت نقطه عطفي در صنعت موسيقي بود وقتي اپل در اوايل 2000، با تجاري‌سازي آهنگ‌ها (پرداخت براي هر آهنگ) اين امکان را فراهم نمود تا شنوندگان بدون هيچ محدوديتي هر آهنگي که دوست دارند، دانلود نمايند.

شرايط کنوني:

امروزه، با استفاده از AI در موسيقي و اپليکيشن‌هاي پخش موسيقي ديگر نيازي نيست همچون گذشته براي هر آهنگ هزينه‌اي پرداخت شود. به جاي آن، اپليکيشن‌ها، از شنوندگان درخواست پرداخت هزينه‌هايي ماهانه يا سالانه براي پخش آهنگ‌هاي بي‌شمار از هنرمندان مختلف مي‌کنند.

شايد برايتان جالب باشد اگر بدانيد که اپليکيشن‌هاي پخش موزيک، روزانه، 20.000 آهنگ جديد در پلتفرم‌هاي خود بارگزاري مي‌کنند.

شرکت‌هاي پخش موسيقي با استفاده از موتورهاي فيلترينگ (filtering engines)، هزارن هزار آهنگ جديد و تازه بارگزاري شده در پلتفرم خود را اسکن کرده تا يک پلي‌ليست بهتر براي شنوندگان خود بسازد و همچنين آهنگ‌هايي نزديک به سليقه آنان را پيشنهاد دهد. اين مهم، شنوندگان را از جست‌وجو در ميان هزاران هزار آهنگ براي يافتن آهنگ مورد علاقه خود، بي‌نياز مي‌کند‌.

به علاوه، موتورهاي فيلترينگ تنها ژانرهاي خاصي را شخصي‌سازي نمي‌کنند، بلکه تعريف تازه‌اي به مفهوم “ژانر” مي‌بخشند. اين تعريف تازه با استفاده از ايجاد يک پلي‌ليست (Playlist) جديد تحت عنوان “آهنگ‌هاي خوب” ممکن مي‌باشد.

انقلاب هوش مصنوعي در موزيکانقلاب هوش مصنوعي در موزيک

آينده هوش مصنوعي در موزيک:

در آينده افراد ديگر به موسيقي گوش فرا نمي‌دهند بلکه آن را با تک تک وجودشان لمس مي‌کنند. با استفاده از پيشرفت‌هاي چشمگير AI در موسيقي و  فناوري واقعيت مجازي، شنوندگان امکان مشاهده موزيسين‌هاي مورد علاقه خود را دارند که به طور اختصاصي براي آنان اجرا مي‌کنند. اين فناوري از طريق شبيه‌سازي‌هاي عصبي- الکتريکي ممکن خواهد شد که در آن افراد موزيک را در تمامي استخوان‌ها، ماهيچه‌ها و مغز خود احساس مي‌کنند. حتي ممکن است آنان به کمک همين شبيه‌سازي‌ها قادر به درک احساس و عواطف هنرمندي باشند که در لحظه براي آنان اجرا مي‌کند.

هوش مصنوعي در موزيک باعث خلاقيت هنرمندان و نوازندگان مي‌شود:

گذشته:

نوازندگان،گروه‌هاي موسيقي و هنرمندان همواره محبوب همه مردمان جهان بوده‌اند. طرفدارانشان علاقه‌مند به تماشاي فرايند خلاقيتيشان در راهي که در پيش گرفتند، بودند. آهنگ‌ها، ترانه‌هاي گاها عجيب ولي دلنشين، و در نهايت اجراي آنان براي تمامي افراد در تمامي جهان بدون توجه به مليت، زبان، مذهب همواره مورد احترام طرفداران بوده است.

الکل، مديتيشن، انزواهاي غيرمعمول، عشق، مردم، اعتراض، فقر و بسياري از موارد اين چنين، موضوعات پيرامون هنرمندان‌اند که همواره مردم به دانستن آنان علاقه‌مندند. براي مثال، روند خلاقانه اديت پياف، اين نوازنده شهير فرانسوي که آهنگ‌هايش در زمان انقلاب فرانسه نمايانگر بازگرداندن شادي، مثبت‌نگري و اميد به فرانسويان بود، نه تنها مورد علاقه تک‌تک فرانسه زبانان بلکه مورد علاقه ديگر مردمان جهان با مليت‌هاي مختلف بود.

شرايط اکنوني:

امروزه فرايند خلاقانه مبتني بر داده و اطلاعات و همچنين AI در موسيقي است.

نوازندگان امروز تمايل دارند تا در مورد اولويت‌ها و علاقه مردمان توسط داده‌هايي که منابع مختلف و شرکت‌هاي اپليکيشن‌هاي پخش موزيک در اختيارشان قرار مي‌دهند، تحقيق نمانيد تا متوجه شوند که چه دسته از موسيقي‌هايي کجا، کدام منطقه، در ميان کدام مذاهب، سنين، زن يا مرد و غيره بيشتر يا کمتر به فروش مي‌رسد.

ديگر اپليکيشن‌هاي AI در صنعت موسيقي، تسلط صوتي (audio mastering) است. به عنوان مثال مي‌توان از شرکت کانادايي Lander در اين زمينه ياد کرد. اين شرکت به نوازندگان کمک مي‌کند تا با صرف زمان و هزينه کمتر (نصف زمان و هزينه جاري)، کيفيت صداي موزيک خود را درست برابر با کيفيت موزيک ضبط شده در استوديوهاي حرفه‌اي بالا برند. چنين اپليکيشن‌هايي با آناليز، تجزيه و تحليل آهنگ‌ها و از طريق اسکن در ميان انبوهي از آهنگ‌هاي مشابه، پيشنهادهايي سريع براي بهبود کيفيت صدا، يونيک و يکتا ساختن آهنگ و اضافه کردن علايق فردي به آن، ارايه مي‌دهند.

انقلاب هوش مصنوعي در موزيکانقلاب هوش مصنوعي در موزيک

آينده AI در موزيک:

پيشرفت هوش مصنوعي در ايجاد موسيقي مبتني بر بايومترک، بر خلاقيت نوازندگان تاثيرهاي شگرفي خواهد داشت. ممکن است در آينده تنها نوازندگاني که دانشي عميق در زمينه علوم اعصاب، روانشناسي و دانش پايه هوش مصنوعي داشته باشد مجال فعاليت يابند. زيرا مجبور به راائه موسيقي هستند که همه اين موارد را در خود جاي داده باشد.

ممکن است سرانجام، هوش مصنوعي، موسيقي خاص خود را توليد نمايد:

بسياري از شرکت‌هاي غول در زمينه موسيقي بر اين باورند در آينده‌اي نه چندان دور، AI  در موسيقي جايگاه ويژه‌اي پيدا خواهد کرد و اين فناوري موسيقي خود را به جهانيان ارايه خواهد داد.

هوش مصنوعي با آناليز ضربان قلب، EQ و غيره و هم‌چنين با در نظر گرفتن ژانر و سبک دلخواه شنونده، براي هر شخص و متناسب با حالات روحي، رواني و جسمي وي موسيقي جديدي توليد خواهد کرد.

زماني را تصور نماييد که هر فرد به موسيقي مخصوص به خود که تنها براي وي توليد شده، گوش فرا خواهد داد.

صرف‌نظر از آنکه در آينده چه رخ مي‌دهد، اما يک چيز مورد يقين است، شيوه شنيدن به موسيقي و نحوه ساخت آن به سرعت در حال تغيير است. با پيشرفت AI در موسيقي ، تغييرات چشم‌گيري در اين صنعت شاهد خواهيم بود.



محمد بازدید : 59 چهارشنبه 15 مرداد 1399 نظرات (0)
هوش مصنوعي و کاربردهاي در مقابله با اپيدمي کويد_19

اين روزها که جهان با بيماري کويد-19 دست به گريبان است، از هر نوآوري و تکنولوژي براي مبارزه با اين بيماري استفاده مي‌شود. مانند بسياري از عرصه‌هاي ديگر، عرصه خدمات بهداشت و درمان نيازمند پشتيباني فناوري‌هاي جديدي مانند هوش مصنوعي (AI)، اينترنت اشيا (IoT)، کلان داده‌ها و يادگيري ماشين است. به تازگي، تجزيه و تحليل داده‌هاي مربوط به بيماري، آماده سازي داده‌ها، پيشگيري و مبارزه با بيماري‌هاي واگيرداري، مانند کويد-19، به يکي از اهداف هوش مصنوعي تبديل شده است.

هوش مصنوعي (AI) و يادگيري ماشين نقش مهمي در درک بهتر، مقابله با بحران کويد-19 و کشف واکسن کويد-19 دارند. فناوري يادگيري ماشين به رايانه‌ها اين امکان را مي‌دهد تا با هوشي که دارند و با تقليد از حجم زيادي از داده‌ها، الگو و سرعت انتشار بيماري را پيش‌بيني کنند. اين فناوري نتيجه محور براي غربالگري مناسب، تجزيه و تحليل، پيش بيني و رديابي بيماران فعلي و بيماران احتمالي آينده مورد استفاده قرار مي‌گيرد. هوش مصنوعي از اطلاعات حاصل از افراد مبتلا به کرونا، افراد بهبود يافته و فوتي به عنوان داده رديابي استفاده مي‌کند.

در راستاي مبارزه با کويد-19، مهارت‌هاي يادگيري ماشين و هوش مصنوعي در زمينه‌هاي ارتباط با بيماران، درک نحوه انتشار کويد-19 و سرعت بخشيدن به تحقيقات و درمان تقويت شده است.

در موسسات بهداشت و درمان، از چت بات‌ها با قابليت يادگيري ماشين براي غربالگري علائم کويد-19 و پاسخ به سوالات بيماران استفاده مي‌شود. يک مثال Clevy.io است، اين شرکت يک استارت آپ فرانسوي است که چت‌باتي را براي ارتباط ساده‌تر مردم با کادر درمان در مورد کويد-19 راه اندازي کرد. اين چت‌بات اطلاعات دقيق و مناسبي را از سوي دولت فرانسه و سازمان بهداشت جهاني دريافت مي‌کند، علائم شناخته شده را ارزيابي مي‌کند و بر اساس اطلاعاتي که کسب کرده است، به سوالات پاسخ مي‌دهد. اين چت‌بات بدون اينکه به پرسنل بهداشت و درمان فشاري وارد کند، روزانه تقريبا 3 ميليون پيام را رد و بدل مي‌کند و قادر به پاسخگويي به سوالات است.

استفاده ديگر از چت‌بات‌ها در زمان مبارزه با فراگيري ويروس کرونا را مي‌توانيد در اينجا بخوانيد.

از طرف ديگر، براي جلوگيري از بروز هرگونه اختلال در زنجيره تأمين مواد غذايي، فرآوران مواد غذايي و دولت‌ها بايد وضعيت فعلي کشاورزي را درک کنند. يکي از استارت آپ‌هاي عرصه کشاورزي، Mantle Labs، يک راه حل نظارت بر محصول AI محور را پيشنهاد داده است. اين فناوري به صورت رايگان در مدت سه ماه در اختيار خرده فروشان قرار گرفت و بر زنجيره تامين نظارت داشت. روش کار به اين صورت است که تصاوير ماهواره‌اي از زمين‌هاي زراعي، از چند ماهواره متفاوت، ترکيب مي‌شود. اين تصاوير با استفاده از مدل‌هاي يادگيري ماشين و پردازش تصوير ارزيابي مي‌شوند، و در آخر شرايط کشاورزي و محصولات زراعي را نشان مي‌دهند.

 

کاربردهاي اصلي هوش مصنوعي در اپيدمي کويد 19

تشخيص زود هنگام و تشخيص عفونت

هوش مصنوعي يکي از فناوري‌هايي است که مي‌‌تواند شيوع اين ويروس را به راحتي رديابي کند، بيماران پرخطر را شناسايي کند، و در کنترل به‌موقع عفونت مفيد است. همچنين مي‌‌تواند با تجزيه و تحليل داده‌هاي قبلي خطر مرگ و مير بيماران را پيش بيني کند. هوش مصنوعي مي‌‌تواند با غربالگري جمعيت، کمک پزشکي، اطلاع رساني و پيشنهادات مربوط به کنترل عفونت در مقابله با اين ويروس به ما کمک کند. اين فناوري پتانسيل بهبود برنامه ريزي، درمان و نتايج گزارش شده از بيمار کويد-19 را دارد و يک ابزار پزشکي مبتني بر شواهد است.

هوش مصنوعي مي‌تواند سريعا علائم را تحليل کند و به بيماران و کادر درمان هشدار دهد. اين فناوري به تصميم گيري سريعتر کمک مي‌‌کند، که مقرون به صرفه است. هوش مصنوعي کمک مي‌کند تا از طريق الگوريتم‌هاي کارآمد، يک سيستم جديد تشخيص و مديريت بيماران کويد-19 را  ايجاد کنيد. هوش مصنوعي به کمک فناوري‌هاي تصويربرداري پزشکي مانند توموگرافي کامپيوتر(CT)، تصويربرداري با رزونانس مغناطيسي (MRI) به تشخيص موارد آلوده کمک مي‌کند.

در عين حال، در زمينه تصويربرداري پزشکي، با استفاده از يادگيري ماشيني، به شناخت الگوهاي موجود در تصاوير کمک مي‌کنند و توانايي راديولوژيست‌ها را براي تشخيص احتمال ابتلا به بيماري و تشخيص زود هنگام بيماري، تقويت مي‌کنند.

 

نظارت بر درمان

هوش مصنوعي مي‌تواند يک بستر هوشمند براي نظارت خودکار و پيش بيني شيوع ويروس کرونا ايجاد کند. همچنين يک شبکه عصبي براي استخراج ويژگي‌هاي بصري اين بيماري ايجاد شده است و اين امر به نظارت و درمان صحيح افراد مبتلا کمک مي‌‌کند. اين فناوري با توجه به اطلاعات بيماران خود را به‌روز مي‌کند و راه‌حل‌هايي را ارائه مي‌‌دهد که در جلوگيري از فراگيري کويد-19 موثر است.

 

 

تشخيص شدت کويد-19

هوش مصنوعي با استفاده از داده‌هاي 160 بيمار مبتلا به کرونا در بيمارستاني در ووهان، چين، توانسته است که با استفاده از موارد موجود در آزمايش خون افراد، احتمال ابتلا به کويد-19 را تا حدي تشخيص دهد. محققان با استفاده از اطلاعات مدلي را ايجاد كردند و هوش مصنوعي را با الگوريتم يادگيري ماشين آموزش دادند تا بتواند الگوهاي کويد-19 را درک کند و شدت اين بيماري را در افراد در بازه 0 (خفيف) تا 100 (بحراني) مشخص کند.

اين مدل با استفاده از داده‌هاي حاصل از 12 بيمار بستري در بيمارستان مختص بيماران کرونايي در شنژن، چين و 1000 بيمار مبتلا به کويد-19 در نيويورک تأييد شد. اين مدل به درستي براي بيماراني که مرخص شدند نسبت به بيماراني که بستري شدند و وضعيت وخيمي داشتند، شدت کمتري را اعلام کرده بود.

اسحاق داپکينز، مسئول ارشد پزشکي مراکز بهداشت خانواده در NYU Langon، گفت: “ابزار پشتيبان تصميم گيري باليني بلادرنگ، در محيط‌هاي سرپايي و درمانگاه‌ها، به تشخيص افراد مبتلا، نظارت و درمان کمک مي‌کند”.
لري مک رينولدز، مدير اجرايي مراکز بهداشت خانواده در NYU Langone افزود: “اميدواريم که اين ابزار بتواند با شناسايي افراد در معرض خطر، عوارض جانبي و شدت بيماري را کاهش دهد”.

 

رديابي افراد

هوش مصنوعي با رديابي افراد مي‌تواند ميزان آلودگي توسط اين ويروس و آلوده‌ترين مناطق را شناسايي کند. از طرفي، با نظارت بر افراد و رفتار گذشته و حال آن‌ها مي‌تواند دوره بيماري و احتمال بروز و اوج مجدد آن را پيش‌بيني کند.

 

پيش بيني مرگ و مير

هوش مصنوعي مي‌‌تواند از داده‌هاي موجود، رسانه‌هاي اجتماعي و سيستم عامل‌هاي رسانه‌اي، در مورد خطرات ناشي از عفونت و شيوع آن ماهيت ويروس را رديابي و پيش بيني کند. علاوه بر اين، مي‌‌تواند تعداد موارد بهبود و مرگ در هر منطقه را پيش‌بيني کند. هوش مصنوعي مي‌‌تواند به شناسايي آسيب پذيرترين مناطق، مردم و کشورها کمک کند و براساس آن اقدامات لازم را انجام دهد.

کشف داروها و واکسن

هوش مصنوعي از داده‌هاي موجود در مورد کويد-19 براي تحقيقات دارويي استفاده مي‌کند. براي کشف و توسعه داروها مفيد است. اين فناوري براي سرعت بخشيدن به تست بلادرنگ دارو استفاده مي‌‌شود، در حالي که آزمايش استاندارد زمان زيادي مي‌‌برد، هوش مصنوعي اين روند را طوري سرعت مي‌بخشد که از توانايي انسان خارج است. هوش مصنوعي به ابزار قدرتمندي براي طراحي آزمايش‌هاي تشخيصي و کشف واکسيناسيون تبديل شده است. هوش مصنوعي به کشف واکسن و درمان، با سرعت بسيار بيشتري از حد معمول کمک مي‌‌کند و همچنين براي آزمايشات باليني در طول کشف واکسن مفيد است.

 

کاهش بار کاري پرستاران

به دليل افزايش ناگهاني و گسترده تعداد بيماران در طول بيماري واگيردار کويد-19، حجم کار متخصصان بهداشت و درمان يکباره بسيار افزايش يافت. هوش مصنوعي به کمک کادر درمان شتافت و حجم کار آن‌ها را بسيار کاهش داد. اين فناوري در تشخيص زودهنگام و ارائه درمان در مراحل اوليه با استفاده از رويکردهاي ديجيتالي و پشتيبان تصميم کمک مي‌‌کند، و از طرف ديگر، بهترين آموزش را به دانشجويان و پزشکان در مورد اين بيماري جديد ارائه مي‌‌دهد. هوش مصنوعي مي‌‌تواند مراقبت‌هاي آينده از بيمار را تحت تأثير قرار دهد و چالش‌هاي احتمالي را که باعث کاهش بار کار پزشکان مي‌‌شود، برطرف کند.

 

جلوگيري از شيوع بيماري

با کمک تجزيه و تحليل بلادرنگ داده‌ها، هوش مصنوعي مي‌‌تواند اطلاعات به روز شده‌اي را ارائه دهد که در پيشگيري از اين بيماري مفيد است. مي‌‌توان از هوش مصنوعي براي پيش بيني مکان‌هاي احتمالي آلوده به ويروس، هجوم ويروس، تعداد تختخواب مورد نياز براي بستري بيماران و متخصصان مراقبت‌هاي بهداشتي در طول اين بحران استفاده کرد. يادگيري ماشين همچنين به محققان و پزشکان کمک مي‌‌کند تا حجم وسيعي از داده‌ها را براي پيش بيني شيوع کويد-19 تجزيه و تحليل کنند، تا به عنوان يک سيستم هشدار دهنده اوليه براي همه گيري‌هاي آينده عمل کرده و جمعيت آسيب پذير را شناسايي کنند.

اطلاعات کسب شده توسط اين فناوري دليل شيوع عفونت را مشخص مي‌کند. در آينده، هوش مصنوعي يک فناوري مهم براي مقابله با ساير بيماري‌هاي واگيردار خواهد بود و همچنين نقش مهمي در ارائه مراقبت‌هاي بهداشتي، پيش بيني بيماري و پيشگيري از بيماري ايفا مي‌‌کند.

محققان Chan Zuckerberg Biohub در کاليفرنيا براي ارزيابي تعداد عفونت‌هاي کويد-19 که کشف نشده‌اند و عواقب آن براي سلامتي عمومي، الگويي را ساختند و 12 منطقه در سراسر جهان را ارزيابي کردند. آن‌ها با استفاده از يادگيري ماشين و توسعه تشخيصي، روش‌هاي جديدي را براي تعيين عفونت‌هاي کشف نشده ايجاد کرده‌اند.

در ابتداي اين بيماري واگيردار، BlueDot، يک شرکت استارتاپ کانادايي و مشتري AWS که از AI براي تشخيص شيوع بيماري استفاده مي‌‌کند، از نخستين کساني بود که زنگ خطر درباره شيوع نگران کننده يک بيماري تنفسي در ووهان چين را به صدا درآورد. BlueDot از AI براي تشخيص شيوع بيماري استفاده مي‌‌کند. BlueDot با استفاده از الگوريتم‌هاي يادگيري ماشين خود، گزارش‌هاي خبري بدست آمده از شبکه‌هاي هوايي و بيماري‌هاي حيوانات، به 65 زبان را، براي کشف شيوع بيماري و پيش‌بيني پراکندگي بيماري، غربال کرد. سپس اپيدميولوژيست‌ها اين نتايج را مرور کرده و تاييد کردند که نتيجه حاصل از نظر علمي اعتبار دارد. BlueDot اطلاعات حاصل شده را در اختيار مسئولان بهداشت عمومي، خطوط هوايي و بيمارستان‌ها قرار داد تا به آنها در پيش بيني و مديريت بهتر خطرات کمک کند.

در ماه مارس، گروهي از متخصصان داوطلب به سرپرستي ديجي پاتيل دانشمند ارشد داده کاخ سفيد براي کمک به يک ابزار برنامه‌ريزي سناريو که تأثير بالقوه کويد-19 و پاسخ به سوالاتي مانند “به چند تخت بيمارستاني نياز خواهيم داشت؟ ” يا “تا کي بايد دستور پناهندگي در محل صادر کنيم؟” با يکديگر همکاري کردند. آن‌ها به يک مدل منبع باز نياز داشتند تا بتوانند برنامه‌هاي تدافعي را در راستاي مبارزه با عفونت و برنامه بستري در بيمارستان را ترتيب دهند.

اين گروه با همکاري نزديک با AWS و دانشکده بهداشت عمومي جانس هاپکينز بلومبرگ، اين مدل را به ابر منتقل کردند و به آنها امکان اجراي چندين سناريو در فقط چند ساعت و اجراي مدل را در 50 ايالت ملي و بين المللي ارائه دادند تا به تصميم گيري‌هايي کمک کند که مستقيماً روي گسترش جهاني کويد-19 تأثير داشت.

سازمان‌ها همچنين روش‌هاي کمتر کردن شيوع کويد_19، به ويژه در ميان جمعيت آسيب پذير، را بررسي کردند. Closedloop، يک استارت آپ هوش مصنوعي است که از داده‌هاي مراقبت‌هاي بهداشتي خود براي شناسايي افراد در معرض خطر عوارض شديد ناشي از کويد-19 استفاده مي‌‌کند. Closedloop يک شاخص آسيب پذيري کويد_19، يک مدل پيش بيني مبتني بر هوش مصنوعي، افراد را که در معرض خطر عوارض شديد ناشي از کويد-19 هستند، با استفاده از منابع باز شناسايي کرد. اين شاخص C-19 توسط سيستم‌هاي مراقبت‌هاي بهداشتي، سازمان‌هاي مديريت مراقبت و شرکت‌هاي بيمه براي شناسايي افراد پرخطر مورد استفاده قرار مي‌‌گيرد، سپس دانش حاصل اعلام مي‌گردد تا اهميت شستن دست‌ها و رعايت فاصله‌هاي اجتماعي را به همه اعلام کند و همچنين اهميت تهيه مواد غذايي، دستمال توالت، و ساير لوازم ضروري براي اينکه بتوانند در خانه بمانند، را مطرح مي‌کند.

 

سرعت بخشيدن به پژوهش و درمان

ارائه دهندگان خدمات بهداشتي و محققان با حجم فزاينده اي از اطلاعات در مورد کويد-19 روبرو هستند، که به دست آوردن بينش‌هايي که بتواند براي درمان مفيد باشد، کار را دشوار مي‌‌کند. در پاسخ، AWS پژوهشي را بر کويد-19 انجام داد، AWS يک وب سايت جستجوي جديد مجهز به يادگيري ماشين است، اين وب سايت به محققين کمک مي‌کند که بتوانند سريع و راحت مقالات و اسناد پژوهشي مرتبط با سوالاتي مانند “چه زماني بالاترين احتمال به آلوده شدن به کويد-19 وجود دارد؟” را پيدا کنند.

اين راه حل يادگيري ماشيني که در انستيتوي آلن براي مجموعه اطلاعات تحقيق کويد-19 با بيش از 128،000 مقاله تحقيقي و ساير مطالب ايجاد شده است، مي‌‌تواند اطلاعات پزشکي مربوطه را از متن بدون ساختار استخراج کرده و از قابليت‌هاي پرس و جو در زبان طبيعي قوي برخوردار است و به کشف سريع دارو کمک مي‌کند.

BenevolentAI، يک شرکت AI در انگلستان و مشتري AWS، بسترهاي خود را به سمت درک واکنش بدن به کرونا ويروس سوق داد. آنها تحقيقاتي را با استفاده از بستر کشف داروي AI براي شناسايي داروهاي تأييد شده که مي‌‌توانند پيشرفت ويروس کرونا را مهار کنند، آغاز کردند. آنها از يادگيري ماشيني براي دستيابي به روابط متني بين ژن‌ها، بيماري‌ها و داروها استفاده کردند که در نهايت به پيشنهاد چند ترکيب دارويي منجر شد. فقط در طي چند روز، هوش مصنوعي Benevolent کشف کرد که داروي Baricitinib (دارويي که در حال حاضر براي آرتريت روماتيد استفاده مي‌شود) قوي ترين گزينه است. Baricitinib اکنون در مرحله آخر آزمايش باليني موسسه ملي آلرژي‌ها و بيماري‌هاي عفوني ايالات متحده (NIAID) قرار دارد تا اثر بخشي و ايمني اين دارو به عنوان يک درمان بالقوه براي بيماران مبتلا به کويد-19 بررسي شود. سرعت آزمايش‌هاي باليني اين دارو، بيانگر همه گيري جهاني اين بيماري و اهميت AI در تسهيل کشف درمان‌هاي جديد است.

 

 

سخن آخر

هوش مصنوعي ابزاري آينده‌نگر و مفيد براي شناسايي عفونت‌هاي زودرسي مانند ويروس کرونا است و همچنين به نظارت بر وضعيت بيماران آلوده کمک مي‌‌کند. با ايجاد الگوريتم‌هاي مفيد مي‌‌تواند به طور قابل توجهي تصميم گيري را بهبود بخشد. هوش مصنوعي نه تنها در درمان مبتلايان به کويد-19 بلکه براي نظارت بر سلامتي آنها مفيد است. هوش مصنوعي مي‌‌تواند بحران کويد-19 را در مقياس‌هاي مختلف مانند عرصه‌هاي پزشکي، مولکولي و اپيدميولوژيکي رديابي کند. همچنين تسهيل تحقيقات در مورد اين ويروس با استفاده از تجزيه و تحليل داده‌هاي موجود مفيد است. هوش مصنوعي مي‌‌تواند در ايجاد رژيم‌هاي درماني مناسب، راهکارهاي پيشگيري، ساخت دارو و واکسن کمک کند.

محمد بازدید : 73 چهارشنبه 08 مرداد 1399 نظرات (0)

در اين مقاله قصد داريم يک نرم افزار صحبت با هوش مصنوعي به شما معرفي کنيم و کاربردهاي آن را بررسي کنيم. اما قبل از هرچيز بياييد ببينيم که منظور از صحبت با هوش مصنوعي و نرم افزار مربوط به آن چيست.

منظور از نرم‌افزار صحبت با هوش مصنوعي همان چت بات است؟

بله منظور از نرم افزار هوش مصنوعي در حقيقت همان چت بات است که به کاربر اين امکان را مي‌دهد تا با يک عامل هوش مصنوعي به تعامل بپردازد. پ چت‌بات‌ها در حقيقت سرويس‌هايي هستند که به کمک هوش مصنوعي مي‌توانند مستقل از عامل انساني با کاربران چت کنند و به سوالات آن‌ها پاسخ دهند. تمام کسب و کارها مي‌توانند در بسترهاي قابل چت، که امروزه در بين کاربران بسيار محبوبيت پيدا کرده است، به کمک چت‌بات ها با مشتريان خود تعامل داشته باشند. البته کارکرد چت‌بات‌ها تنها براي پشتيباني از کسب و کارها نيست بلکه مي‌توانند جنبه‌هاي کاربردي متفاوتي اعم از سرگرمي تا عملکردي داشته باشند.

در حقيقت به طور کلي دو نوع چت بات وجود دارد که مي توانند مکالمات انساني را شبيه سازي کنند و به تعامل با کاربران بپردازد. اين دو نوع چت بات عبارتند از:

چت بات هاي مبتني بر داده هاي از پيش تعيين شده:

اين نوع چت بات ها داراي چهارچوب کارکردي به خصوصي هستند. به اين معني که آن ها تنها مي توانند به دستورات و سوال هاي خاصي پاسخ بدهند و از يک اسکريپت و جريان از پيش تعريف شده پيروي مي کنند. آنها فقط به همان اندازه هوشمند هستند که شما آن‌ها را مي سازيد. نکته مورد توجه در اين چت بات‌ها آن است که فقط مي توانيد از آن ها سوال هاي مشخصي بپرسيد. چت بات‌هاي مبتني بر اسکريپت اغلب به عنوان دستيار خريد يا براي کارهاي ساده مانند پيش بيني وضعيت هوا در خدمات به مشتريان استفاده مي شود.

کاربردهاي اپراتور مجازي هوشمند

چت بات هاي مبتني بر هوش مصنوعي:

اين نوع از چت بات ها توانايي استفاده از هوش مصنوعي را دارند و با استفاده از يادگيري ماشين به جواب پرسش‌ها و يا صحبت‌هايي که با آن‌ها مي‌شود مي‌رسند. به اين معني که نيازي نيست سوال‌هاي کاربران مشخص و ساده باشد، چت بات‌هاي هوشمند قادر هستند سوال را تجزيه و تحليل کنند و پس از درک آن پاسخ مناسب را ارائه دهد. نکته مثبت اين چت بات ها يادگيري بيشتر با گذشت زمان است. اين چت بات‌ها مي توانند بر اساس تاريخچه جستجوي و يا لايک‌ها و ديس لايک‌هاي کاربر در صفحات اجتماعي و… به سليقه و علايق آن‌ها پي ببرد.

پر واضح است که منظور ما از صحبت با هوش مصنوعي نيز چت بات نوع دوم مي‌باشد. اين چت بات‌هاي هوشمند توانايي ايجاد مکالمه و برقراري ديالوگ را دارد.

کاربردهاي چت بات چيست؟

چت بات‌هاي هوشمند علاوه بر توانايي ايجاد مکالمه با کاربر، کاربردهاي متفاوت ديگري را هم بر روي وب‌سايت،پيام رسان‌ها و… دارند که همه به نوعي از همان توانايي برقراري مکالمه سرچشمه مي‌گيرد. در ادامه به بررسي برخي از آن‌ها مي‌پردازيم.

دسترسي

با استفاده از چت بات هوشمند بر روي وبسايت کاربر مي‌تواند به راحتي و در هر زماني و در هر مکاني که هستند از طريق گوشي و يا لپ‌تاپ و… به آن مراجعه کند و از خدماتش بهره‌مند شود.

فعاليت 24 ساعته

چت بات‌هاي هوشمند مي‌توانند در هر ساعتي از شبانه روز و در هر هفت روز هفته بر روي سايت و يا يک پيام‌رسان فعاليت داشته باشند و به پرسش‌هاي کاربران پاسخ دهند. چت بات‌هاي هوش مصنوعي نيازي به استراحت ندارند و مي‌توانند به صورت 24 ساعته کار کنند و به فعاليت و خدمات رساني و تعامل با کاربران بپردازند و به سوالات آن‌ها پاسخ دهند.

ارائه اطلاعات مورد نياز به کاربر

چت بات‌هاي هوشمند داراي هوش مصنوعي قادرند تا محتواي سوال‌هايي که دريافت مي‌کنند را تشخيص دهند و آن‌ها را تجزيه و تحليل کرده و نکات کليدي موجود در صحبت را استخراج کرده و خواسته و منظور اصلي مشتري را درک کنند و پاسخ متناسب با آن را به مشتري ارائه دهند. تمامي اين فرآيندها در کسري از ثانيه اتفاق مي‌افتد و در زمان بسيار کمي مشتري به تمام آنچه که نياز داشت، مي‌رسد.

ارائه پيشنهادات شخصي سازي شده

يکي از کارهايي که چت بات‌هاي هوشمند مي‌توانند انجام دهند ارائه خدمات و پيشنهادات شخصي سازي شده به کاربران است. يک چت بات با توجه به سابقه جست و جوي کاربر در سايت و يا تاريخچه خريدها و سوالاتي که او تا به حال پرسيده است، مي‌تواند پيشنهاد خريد و يا خدمات شخصي سازي شده و متناسب با آن کاربر را به او ارائه دهد.

محمد بازدید : 63 پنجشنبه 02 مرداد 1399 نظرات (0)

اهميت هوش مصنوعي در چيست؟

هوش مصنوعي (Artificial Intelligence) مبنايي است براي تقليد رايانه و يا ماشين‌ها از فرآيندهاي هوش انساني که از طريق ايجاد و استفاده از الگوريتم‌ در يک محيط محاسبات پويا به وجود مي‌آيد. به زبان ساده، هوش مصنوعي در تلاش است تا رايانه‌ها را مانند انسان‌ها به فکر و سپس عملکرد بکشاند و کمک کند تا کارهايي که نياز به هوش انساني دارد را انجام دهند.

رسيدن به اين هدف به سه مؤلفه اصلي نياز دارد:

  • سيستم‌هاي محاسباتي
  • مديريت داده‌ها و مديريت داده‌ها
  • الگوريتم‌هاي پيشرفته هوش مصنوعي (کد)

براي اينکه نتيجه اين سيستم به رفتارهاي انساني نزديک‌تر باشد، به داده و قدرت پردازش بيشتري نياز دارد.

چگونگي ايجاد هوش مصنوعي

مي‌توان گفت حداقل از قرن يک قبل از ميلاد مسيح، انسان احتمال ايجاد ماشين‌هايي که از مغز انسان تقليد مي‌کنندرا در ذهن خود پرورانده است . نخستين بار در دوران مدرن و در سال 1955 اصطلاح هوش مصنوعي توسط جان مک کارتي ابداع شد. در سال 1956، مک کارتي و ديگر  فعالان اين حوزه کنفرانسي را با عنوان “پروژه تحقيقاتي تابستاني دارتموت در زمينه هوش مصنوعي” ترتيب دادند. اين مسئله شروعي براي ايجاد يادگيري ماشين، يادگيري عميق، مسئله تجزيه و تحليل پيشبيني و امروزه نيز تجزيه و تحليل تجربي محسوب مي‌شود. اين مسئله همچنين حوزه‌اي کاملاً جديد در زمينه مطالعه علم داده ايجاد کرد.

چرا هوش مصنوعي مهم است؟

امروزه، ميزان داده‌هايي که توسط انسان و ماشين‌ها ايجاد مي‌شو آنقدر زياد است که جذب، تفسير و تصميم گيري‌هاي پيچيده بر اساس آن داده‌ها از توانايي انسان فراتر مي‌رود. هوش مصنوعي پايه و اساس تمام يادگيري رايانه‌ها را تشکيل مي‌دهد و آينده تصميم گيري‌هاي پيچيده است. به عنوان نمونه، بيشتر انسان‌ها مي‌توانند بفهمند که چگونه نبايد در بازي‌هاس مختلف پس از آزمون و خطاي بسيار برنده شوند و حتي روند بازي را تشخيص دهند. تعداد افراد کمي در دنيا به عنوان بزرگترين قهرمانان بازي چکر در نظر گرفته مي‌شوند که بيش از 500 ميليارد حرکت متفاوتي مي‌تواند داشته باشد. استفاده از رايانه‌ها در محاسبه اين ترکيب‌ها و جابجايي‌ها، براي دستيابي به بهترين تصميم بسيار کاربردي است. هوش مصنوعي (و تحول آن در يادگيري ماشين) و يادگيري عميق آينده اساسي براي تصميم گيري در مورد کسب و کار و بسياري از حوزه‌هاي ديگر رقم است.

موارد استفاده از هوش مصنوعي

برنامه‌هاي کاربردي مبتني بر هوش مصنوعي را مي‌توان در حوزه‌هاي مختلفي مانند تشخيص تقلب در خدمات مالي، پيشبيني خريد در خرده فروشي و تعامل آنلاين و پشتيباني از مشتري به کار برد. در اينجا چند مثال اين زمينه آورده شده است:

  • تشخيص تقلب: حوزه خدمات مالي به دو روش از هوش مصنوعي استفاده مي‌کند. امتيازدهي اوليه برنامه‌هاي اعتباري که از هوش مصنوعي براي درک اعتبار استفاده مي‌کند و ديگر اينکه از موتورهاي پيشرفته هوش مصنوعي براي نظارت و کشف معاملات جعلي در پرداخت در زمان کوتاه استفاده مي‌شود.
  • دستيار مجازي مشتري (VCA): مراکز تماس از VCAها براي پيشبيني و پاسخ به سوالات مشتري بدون نياز به عامل انساني استفاده مي‌کنند. تشخيص صدا، همراه با گفتگوي شبيه سازي شده به تعاملات انسان، اولين نکته تعامل دستياران مجازي با مشتري است. در زماني که سوالات مشتري سطح بالاتر از درک و توان هوش مصنوعي باشد، به طور خودکار، مشتري به يک عامل انساني هدايت مي‌شود. براي مثال هنگامي که يک شخص از طريق چت بات گفتگو را در يک صفحه از وب‌سايت آغاز مي‌کند، آن فرد اغلب در حال تعامل با رايانه‌اي است که داراي هوش مصنوعي پيشرفتهاست. اگر اين چت بات هوشمند نتواند سؤال او را تفسير کند يا به آن جوابي مناسب دهد، يک انسان براي برقراري ارتباط مستقيم با مشتري مداخله مي‌کند.

تحول فناوري اطلاعات و ارتباطات به کمک هوش مصنوعي

سخن پاياني

به طور کلي دلايل اهميت هوش مصنوعي بسيار زياد هستند و نمي‌توان آن‌ها را تنها در يک مقاله گنجاند. هوش مصنوعي مي‌تواند بسياري از فرآيندهاي موجود در کسب و کارها را به تنهايي انجام دهد، حجم کاري نيروهاي انساني را به طور چشمگيري کاهش دهد، بازدهي يک سازمان را افرايش دهد، در زمان و هزينه و بسياري از منابع ديگر صرفه جويي کند و… . همه اين‌ها از اهميت هوش مصنوعي به خصوص براي کسب و کارها است. البيته هوش مصنوعي قادر است زندگي خصوصي انسان‌ها را نيز دچار تحول کند.

محمد بازدید : 239 پنجشنبه 26 تیر 1399 نظرات (0)

تشخیص گفتار خودکار (ASR) در فیسبوک با کمک هوش مصنوعی با تحولی عظیمی روبه‌رو شده است. طوری‌که این موتور از تمامی رقیبان خود متمایز و برجسته ساخته است.

موتور جدید فیسبوک

دانشمندان تشخیص گفتار خودکار (ASR) در فیسبوک مدل جدیدی را توسعه دادند که قابلیت درک 51 زبان مختلف را دارد. این مدل که با بیش از 16000 ساعت ضبط صدا ساخته شده، از بزرگ‌ترین طراحی‌های این شرکت به شمار می‌آید.

گفتنی است موتورهای ASR معمولا قادر به درک تنها یک زبان هستند. بدین ترتیب، برای ارتباط برقرار ساختن با بیش از یک زبان، ترکیب مدل‌های مختلف ASR برای دستیار صوتی و بالا بردن تکنولوژی‌های گفتار لازم و ضروری است. فیسبوک با استفاده از مدلی که توسعه‌دهندگان آن را مدل رشته به رشته (sequence-to-sequence model) می‌نامند، قرار دادن زبان‌های مختلف در یک سیستم واحد را ممکن ساخته است. در اصل، فیسبوک برای ساختن این مدل از ساعت‌ها داده‌های صوتی جمع‌آوری شده از و فیلم‌های ناشناس بارگذاری شده بر اپلیکیشن فیسبوک استفاده کرده است. هدف نهایی موتور تشخیص گفتار، تمیز قایل شدن زبان متکلم است و آنچه که سعی در بیان آن را دارد.

در این سیستم زبان‌های مختلف به چندین زیرشاخه تبدیل می‌شوند. این کار به منظور پاسخ به زبانی است که شخص در حال گفت‌وگو با آن است.

مدل واحد ارائه شده توسط فیسبوک، قابلیت تشخیص همزمان چندین زبان را دارد. این پروژه از جمله پروژه‌های بلند مدت فیسبوک بود که با موفقیت انجام شد. به طور کل، پردازش گفتار به چند زبان مختلف، دهه‌هاست که به منطقه فعال تحقیقاتی تبدیل شده است.

تقریبا بیلیون‌ها بیلیون‌ پارامتر مختلف برای زبان در مدل جدید فیسبوک در نظر گرفته شده که فرایند تشخیص گفتار را در مقایسه با مدل‌های معمولی برجسته‌تر ساخته است. گفتنی است که پیشرفت عملکرد مدل جدید ارائه شده توسط فیسبوک، 28.8% است.

زبان‌هایی که ساعات ضبط کمتری داشته‌اند، از نظر میزان خطای واژگانی، درصد خطای بیشتری دارند. علت را می‌توان در این امر جست‌وجو کرد که این زبان‌ها به طور معمول برای طراحی‌های استانداردهای روز دنیا استفاده نمی‌شوند.

مطابق با سخنگوی فیسبوک، این پروژه، اولین و بزرگ‌ترین پروژه در زمینه تشخیص گفتار در جهان است که در مقیاسی بزرگ، زبان‌های زنده گوناگون جهان را مورد مطالعه قرار داده است. سخنگوی فیسبوک همچنین ادامه داد که “ما نشان دادیم که امکان برقراری 51 زبان زنده مختلف در دنیا در یک ساختمان واحد و حجیم ASR وجود دارد.

صدای تشخیص گفتار فیسوک

علاقه فیسبوک به مدل واحد پردازش گفتار که قادر به درک و ارتباط به زبان‌های متفاوت باشد، فراتر از حد آکادمیک و دانشگاهی است. به همین منظور، این شرکت سرمایه‌گذاری عظیمی در بهبود هوش مصنوعی مکالمه‌ای در جبهه‌های مختلف کرده است. این شرکت، اخیرا فعالیت بر یک چت‌بات جدید مبنع باز (open source) با نام بلندر (Blender) را آغاز کرده است.  ظاهرا، این چت‌بات نسبت به بسیاری از چت‌بات‌های رقیب مانند چت‌بات جدید گوگل مینا (Google’s new Meena Chatbot) قوی‌تر و پیشرفته‌تر است. بلندر برای ادامه گفت‌وگو با کاربران در هر زمینه‌ای و نشان دادن همدلی با آنان طراحی شده است. فیسبوک همچنان تلاش دارد تا با استفاده از جمع‌آوری داده‌های صوتی موتورهای تشخیص گفتار خود را قوی‌تر از پیش نماید. برای این منظور، به کاربرانی که فایل‌های صوتی خود را از طریق اپلیکیشن تحقیقاتی Viewpoint market فیس‌بوک بارگذاری کنند، هزینه کمی پرداخت می‌نماید.

چنین پروژه‌هایی به همراه آزمایش‌های جدید، ممکن است زمینه جدیدی برای دستیار صوتی در سیستم عامل فیسبوک فراهم آورد. سیستم واحدی که قادر به تکلم و ارتباط برقرار کردن به چندین و چند زبان زنده دنیا باشد، برای بقای این شرکت در صحنه بین‌الملل لازم و ضروری است.

جمع‌بندی

الکسا و دستیار گوگل (Google Assistant)، بسیار قبل‌تر از فیسبوک از موتورهای تشخیص گفتار استفاده می‌کردند و قادر به تکلم به زبان‌های مختلفی بودند، اما حالت‌های چند زبانه آنان دارای محدودیت‌های قابل توجهی است. الکسا توانایی تشخیص و پاسخگویی به زبان‌های انگلیسی، اسپانیایی، فرانسوی و هندی با توجه به موقعیت جغرافیایی گوینده دارد. در همین حال، دستیار گوگل (Google Assistant) قادر به تشخیص و پاسخگویی دو زبان، انگلیسی و هر زبان دیگری که قبلا توسط دستیار صوتی گوگل (voice assistant) با آن صحبت شده، است.

محمد بازدید : 95 پنجشنبه 12 تیر 1399 نظرات (0)

استفاده از ربات هوشمند پاسخگویی برای بخش پشتیبانی مشتریان در کسب و کارها (یا همان چت بات‌های هوشمند) یکی از کاربردهای به نسبت جدید و بسیار کمک کننده هوش مصنوعی است. مدتی می‌شود که شرکت‌های بزرگ خارجی از چت‌بات‌های هوشمند برای پشتیبانی از مشتریان بر روی پلتفرم‌های مختلف اعم از وب‌سایت، پیام‌رسان‌ها و یا صفحات شبکه‌های اجتماعی‌شان استفاده می‌کنند. این مسئله باعث می‌شود تا مشتریان در هر لحظه و هر کجایی که هستند بتوانند از خدمات هر کسب و کار بهره‌مند شوند.

تا به حال بارها از مزیت چت‌بات‌ها صحبت کرده‌ایم. اما سوالی که وجود دارد آن است که کسب و کارهای ایرانی هم می‌توانند از چنین تکنولوژی و خدماتی بهره‌مند شوند؟ آیا چت باتی درست شده که بتواند زبان فارسی را به خوبی متوجه شود و به کمک هوش مصنوعی خود بتواند مستقل از نیروی انسانی با مشتریان، در هر ساعتی از شبانه روز، به تعامل بپردازد؟ خوشبختانه پاسخ این سوال بله است و اتفاقا ما قصد داریم در این مقاله یک چت بات هوشمند مبتنی بر هوش مصنوعی را معرفی کنیم و قابلیت‌ها و توانایی‌های آن را بر شماریم تا اگر شما به چنین تکنولوژی در کسب و کارتان نیاز داشتید با خیال راحت به سراغ این محصول بیاید. پس در ادامه با ما همراه باشید.

ربات پاسخگوی هوشمند یعنی چه؟

منظور از ربات هوشمند پاسخگو، چت بات‌های هوشمندی است که بتواند به صورت هوشمند و با کمک هوش مصنوعی با کاربران، در هر بستری که بتوان در آن چت کرد و قابلیت ادغام با یک چت‌بات را داشته باشد، به تعامل بپردازد و بدون نیاز به نیروی انسانی و به صورت مستقل به سوالاتشان پاسخ دهد. بسترهایی که یک چت‌بات می‌تواند در آن فعالیت کند متنوع است و می‌تواند هر کدام از شبکه‌های اجتماعی، پیام رسان‌ها، وب‌سایت کسب‌وکارها و… مانند تلگرام، اینستاگرام و… باشد. چت بات‌های هوشمند نه تنها به عنوان پشتیبان وب‌سایت یک فروشگاه آنلاین و ارائه دهنده اطلاعات به کاربر، بلکه به عنوان یک دستیار هوشمند که توانایی‌های مختلفی مانند راهنمایی و مشاوره در زمان خرید را دارد نیز استفاده می‌شود.

به دلیل اینکه این چت‌بات‌های هوشمند از دو عامل در دسترس بودن به صورت 24 ساعته و در بستر چت بودن برخوردار هستند، یکی از گزینه‌های کلیدی برای پشتیبانی و ارائه خدمات به کاربران در وبسایت‌های فروشگاه‌های آنلاین تبدیل شده‌اند. چت‌بات‌های مبتنی بر هوش مصنوعی با استفاده از یادگیری ماشین و یادگیری عمیق می‌توانند به جواب مناسب مشتریان برسند. آن‌ها هم می‌توانند با کاربر به مکالمه بپردازند و هم به او خدمات و یا محصولات مناسبش را ارائه دهند یا او را راهنمایی کنند تا به هر آنچه که می‌خواهد دسترسی پیدا کند.

معرفی باتاوا، ربات هوشمند پاسخگو برای کسب و کارها

باتاوا یک دستیار هوشمند سازمانی و چت‌بات هوشمند محصول شرکت عامر اندیش هوشمند است. دستیار هوشمند سازمانی باتاوا، یک دستیار متنی و صوتی است که با استفاده از آخرین روش های هوش مصنوعی و یادگیری ماشین در زبان فارسی، به راحتی برای کاربردهای مختلف در سازمان‌ها قابل شخصی سازی است. باتاوا به سازمان‌ها کمک می‌کند تا برای ارتباط 24 ساعته و کم هزینه با مشتریان و یا مراجعه کنندگانشان، دیگر نیازی به پاسخگوهای انسانی نداشته باشند و بتوانند با استفاده از داده های اطلاعاتی که از قبل آموخته‌اند پاسخی متناسب به مشتریان ارائه دهند. باتاوا می‌تواند به خوبی به عنوان یک ربات هوشمند پاسخگویی به مشتریان شما و پشتیبانی از آن‌ها را انجام دهد.

قابلیت‌های باتاوا

چت‌بات هوشمند باتاوا قابلیت‌های متنوعی دارد و از ویژگی‌های منحصر بفردی برخوردار است که در ادامه به آن‌ها اشاره می‌شود:

  • درک متن سوالات مشتریان سازمان
  • شخصی سازی اپلیکیشن موبایل برای سازمان ها
  • پاسخگویی 24 ساعته در طول شبانه روز
  • ارائه وب سرویس برای یکپارچگی با نرم افزارهای موجود
  • نصب و راه اندازی درون سازمانی
  • امکان فعال کردن حوزه های چت بات عمومی
  • بهره مندی از آخرین تکنولوژیهای یادگیری عمیق
  • قابلیت درک متن محاوره ای
  • قابلیت انتقال ارتباط به اپراتورهای انسانی در صورت نیاز
  • توسعه و تولید بصورت کاملاً بومی در داخل کشور
  • ارائه پاسخ مناسب در قالب متن، تصویر، ویدئو، نقشه و …
  • بهره مندی از دایره واژگان (فرهنگ لغت) بسیار وسیع (بالای 270 هزار لغت)

کاربردهای باتاوا

از باتاوا می‌توان کاربردها و موارد استفاده‌ متنوعی را انتظار داشت که عبارتند از:

  • بهره مندی از آخرین تکنولوژی‌های یادگیری عمیق
  • قابلیت درک متن محاوره ای
  • قابلیت انتقال ارتباط به اپراتورهای انسانی در صورت نیاز
  • توسعه و تولید بصورت کاملاً بومی در داخل کشور
  • ارائه پاسخ مناسب در قالب متن، تصویر، ویدئو، نقشه و …
  • بهره مندی از دایره واژگان (فرهنگ لغت) بسیار وسیع (بالای 270 هزار لغت)

مزیت‌های باتاوا

استفاده از چت بات‌های هوشمندی مانند باتاوا مزایای بسیاری را برای کسب‌وکار شما به همراه خواهد داشت. توجه داشته باشید که زمانی که از یک چت بات هوشمند برای پشتیبانی از مشتریان استفاده می‌کنید برای کاربر نوعی دستیار و همراه ایجاد کرده‌اید که هر لحظه می‌تواند در کنار او باشد و به سوالاتش پاسخ دهد. به طور کلی مزایای چت بات‌های هوشمندی مانند باتاوا به شرح زیر است.

دسترسی

به کمک چت بات‌های هوشمند کاربر می‌تواند به راحتی و در هر زمانی از طریق گوشی و یا لپ‌تاپ و… به شما مراجعه کند و از خدمات شما در قالب یک ربات هوشمند پاسخگو بهره‌مند شود. ضمنا در هر مکانی هم که باشد می‌تواند از خدمات شما استفاده کند و بدون فوت وقت به آنچه که نیاز دارند برسند.

فعالیت 24 ساعته

چت بات‌های هوشمند می‌توانند در هر ساعتی از شبانه روز و در هر هفت روز هفته بر روی سایت فعالیت داشته باشند و به پرسش‌های کاربران پاسخ دهند. هوش مصنوعی این چت بات‌های هیچ‌گاه خسته نمی‌شود و نیازی به استراحت ندارد و می‌تواند به صورت 24 ساعته کار کند و به فعالیت و خدمات رسانی و تعامل با کاربران بپردازد و به سوالات آن‌ها پاسخ دهد.

استفاده از api محصول فارس آوا برای تبدیل گفتار به نوشتار

ارائه اطلاعات مورد نیاز به کاربر

چت بات‌های هوشمندی که دارای هوش مصنوعی هستند، همانند باتاوا، می‌توانند محتوای سوال‌هایی که دریافت می‌کنند را درک  و تجزیه و تحلیل کرده و نکات کلیدی موجود در صحبت را استخراج کنند و خواسته و منظور اصلی مشتری را بفهمند و پاسخ متناسب را به مشتری ارائه دهند. تمامی این فرآیندها در کسری از ثانیه اتفاق می‌افتد و در زمان بسیار کمی مشتری به تمام آنچه که نیاز داشت، می‌رسد.

ارائه پیشنهادات شخصی سازی شده

یکی از کارهایی که چت بات‌های هوشمندی همانند باتاوا می‌توانند انجام دهند ارائه خدمات و پیشنهادات شخصی‌سازی شده است. یک چت بات با توجه به سابقه جستجوی کاربر در وب‌سایت کسب‌و‌کار شما و یا تاریخچه خریدها و سوالاتی که او تا به حال پرسیده است، می‌تواند پیشنهاد خرید و یا خدمات شخصی سازی شده و متناسب با آن کاربر را به او ارائه دهد.

حالا که با باتاوا به عنوان ربات هوشمند پاسخگویی که می‌تواند پشتیبانی مشتریان شما را به صورت تمام و کمال انجام دهد آشنا شدید، می‌توانید به صفحه تماس با ما مراجعه کرده و با ارسال درخواست دمو رایگان، از دموی محصول متناسب با کسب و کار خود برخوردار شوید.

محمد بازدید : 29 سه شنبه 10 تیر 1399 نظرات (0)

تفاوت هوشتل با سیستم پاسخگوی خودکار تلفن (IVR)

تا به حال از مزایا و کاربرد های محصول هوشتل در شرایط مختلف صحبت کرده ایم. هوشتل به عنوان یک اپراتور هوشمند می تواند به صورت خودکار پاسخگوی کسانی باشد که با مراکز پشتیبانی کسب و کار ها تماس می گیرند و به عبارتی یک پاسخگوی خودکار تلفنی باشد که می تواند از طریق مکالمه نیاز های تماس گیرنده را درک نماید و به آن ها پاسخ دهد. شاید شما بپرسید که سیستم های پاسخگوی IVR نیز می توانند به صورت خودکار پاسخ تلفن مراکز تماس را بدهند و چه نیازی است به هوشتل و چرا باید هزینه دیگری را متقبل شد تا از اپراتور مبتنی بر هوش مصنوعی در مراکز تماس استفاده کرد؟ ما در این مقاله قصد داریم تا به همین سوال پاسخ دهیم و بگوییم هوشتل قرار است چه مزیت های فوق العاده ای را برای کسب و کار شما و مشتریانتان به همراه داشته باشد.

آیا هوشتل یک پاسخگوی خودکار تلفن است؟

به طور کلی می توان گفت بله هوشتل می تواند پاسخگوی خودکار تلفن نیز باشد. اما کاربردهای محصول هوشتل بسیار فراتر از صرفا پاسخ دهی خودکار تلفن است.هوشتل یک ربات پاسخگوی هوشمند در مراکز تماس تلفنی است که  می تواند جایگزین اپراتورهای انسانی شود و به صورت اتوماتیک و با استفاده از هوش مصنوعی پاسخگوی تماس های مشتریان شما باشد. این محصول یک سامانه کامل برای برقراری ارتباط با مشتری به زبان فارسی و بروی بستر VOIP است که به صورت هوشمند صحبت های مشتری را شنیده و آن ها را تبدیل به متن کرده، سپس به پردازش متن های دریافتی پرداخته و در انتها پس از یافتن پاسخ مناسب، به مانند یک عامل انسانی آن را برای مشتری اعلام می کند.

پاسخگوی خودکار تلفن به کمک هوش مصنوعی

قابلیت های محصول هوشتل عبارتند از:

  • بهره مندی از موتور تبدیل گفتار به متن سفارشی سازی شده
  • بهره مندی از موتور پردازش طبیعی متن
  • بهره مندی از موتور تبدیل متن به گفتار
  • کاهش نیروی انسانی (جایگزینی با ربات پاسخگو)
  • افزایش دسترس پذیری با ارائه خدمات 24 ساعته به تماس گیرندگان
  • به صفر رساندن اشغالی خطوط تلفن در زمان های ترافیک بالا
  • کاهش مدت زمان انتظار کاربر برای پاسخگویی
  • سازگاری با تمامی مراکز تلفن روی بستر VOIP
  • درک سوالات مشتریان سازمان بمنظور برقراری مکالمه هوشمند با کاربر برای رسیدن به پاسخ مناسب
  • انتقال تماس به یک اپراتور انسانی در صورت عدم یافتن جواب مناسب
  • نصب و راه اندازی درون سازمانی
  • بهره مندی از آخرین تکنولوژیهای یادگیری عمیق
  •  قابلیت درک مکالمات محاوره ای
  •  توسعه و تولید بصورت کاملاً بومی در داخل کشور
  • امکان شخصی سازی نحوه پاسخگویی یا ارائه خدمت به تماس گیرندگان هر سازمان
  • کاهش ریسک پاسخگویی یا ارائه خدمت اشتباه

محصول هوشتل می تواند کاربردهای زیر را داشته باشد:

  • استفاده در مراکز بزرگ اطلاع رسانی مانند 118، 137 و 141
  • امکان استفاده در مراکز تماس (اطلاعاتی، پشتیبانی، پاسخگویی و …)
  • امکان استفاده به جای سیستم های IVR
  • استفاده در CRM برای آنالیز تماس ها
  • استفاده در شرکت های دارای خدمات تلفنی مانند سفارش تلفنی کالا
  • استفاده برای نظرسنجی ها
  • استفاده برای نوبت دهی در سازمان ها و ارگان ها
  • استفاده در شرکت ها برای برقراری تماس با اشخاص خاص

سیستم پاسخگوی خودکار تلفن یا IVR چیست؟

سیستم های پاسخگوی خودکار تلفن IVR در واقع همان صوت های ضبط شده ای هستند که هنگام تماس با یک سازمان و … به شما پاسخ می دهند و می گویند که چه دکمه ای را بزنید تا به چه بخشی متصل شوید. IVR کوتاه شده و مخفف Interactive Voice Response می باشد که ترجمه فارسی آن “پاسخگوی صوتی تعاملی است. در اصطلاح IVR به سیستم هایی اطلاق می شود که با گرفتن شماره یک قطعه صوتی ضبط شده فعال می شود و شنونده را راهنمایی می کند تا با گرفتن شماره یا زدن یک کاراکتر (* یا #)، به سیستم بفهماند که چه داده ای را باید از پایگاه داده برای او بخواند. برای مثال می توانیم به سیستم های تلفن بانک ها اشاره کنیم. این سیستم ها در هر مرحله به شما می گوید که برای انجام درخواستتان باید چه شماره و یا کاراکتری را وارد کنید.

هوشتل چه تفاوت هایی با سیستم های پاسخگوی خودکار تلفن IVR دارد؟

تفاوت اصلی محصول هوشتل به عنوان یک اپراتور دارای هوش مصنوعی با سیستم پاسخگوی خودکار IVR، در هوشمند بودن و درک نیاز مخاطب است. هوشتل می تواند صحبت های مشتریان را درک کند و به سوال هایی که می پرسند پاسخ دهد. تفاوت مهم دیگری که هوشتل نسبت به سیستم های IVR دارد، توانایی برقراری دیالوگ است. در پاسخگوی خودکار IVR سیستم به صورت یکطرفه یکسری اطلاعات را به تماس گیرنده اعلام می کند و اگر مشتری بخواهد سوالی بپرسد، نمی تواند پاسخگوی او باشد. در مواردی همانند بیمارستان‌ها سیستم ‌IVR دارای لیستی بلند بالا از درمانگاه ها و نام پزشکان است. در چنین مواقعی امکان فراموش شدن موارد توسط تماس گیرنده وجود دارد یا اینکه فرد در مواجهه با تعداد زیادی نام دچار اشتباه می شود. روند کارکرد محصول هوشتل در این زمینه بسیار متفاوت است. به کمک هوشتل، بات مبتنی بر هوش مصنوعی با کاربر دیالوگ برقرار می کند و بر اساس آنچه کاربر می گوید، برای او نوبت دکتر و … تنظیم می کند.

مزیت های هوشتل نسبت سیستم های پاسخگوی IVR چیست؟

در مورد تفاوت های هوشتل با سیستم‌های پاسخگوی خودکار IVR صحبت کردیم. حال می‌خواهیم بررسی کنیم که هوشتل چه مزیت‌‌های چشمگیری نسبت به سایر سیستم‌های پاسخگوی خودکار تلفن دارد.

پاسخگوی هوش مصنوعی در برابر نیروی انسانی

بیان خواسته کاربر در یک جمله

هر بار که کاربر با یک سیستم IVR تماس می‌گیرد باید لیست بلندی از اسامی و یا بخش‌های یک سازمان را بشنود و سپس از بین آن‌ها شماره مورد نظر را وارد کند. در حالی که با هوشتل روند این چنین نیست. کاربر زمانی که با اپراتور هوشتل تماس می‌گیرد می‌تواند تنها با بیان یک جمله کوتاه و صریح به خواسته خود برسد. به عنوان مثال زمانی که برای نوبت پزشک با بیمارستانی تماس می‌گیرد می‌تواند در یک جمله کوتاه بگوید که “من یک نوبت می خواهم از دکتر احمدی برای دوشنبه ساعت 4 بعد از ظهر” و هوشتل در صورتی که  زمان گفته شده خالی باشد، آن را برای تماس گیرنده رزرو می‌کند. در اینجا کاربر می‌تواند دقیقا خواسته خود را بیان کند و هوشتل نیز با درک آن خواسته پاسخ مناسب را برای او تعبیه کند.

کاهش زمان تماس و اشغال بودن خطوط تلفن

با توجه به مورد قبل، زمانی که کاربر با اپراتور هوشتل سر و کار دارد، در زمان کوتاهی می تواند پاسخ نیازش را بگیرد. لذا زمان تماس ها کوتاه تر شده و هر بات می‌تواند به تعداد بیشتری تماس گیرنده پاسخ دهد. از طرف دیگر هر کسب و کاری با برآورد نیاز در مرکز تماس خود و استفاده از تعدادی بات هوشتل، می توانند همزمان به مشتریانی که با این مراکز تماس می‌گیرند پاسخ دهی کنند. به این ترتیب میزان اشغال شدن خطوط مرکز تماس تا حد زیادی کاهش میابد.

کاهش تماس های از دست رفته مراکز تماس

با استفاده از هوشتل دیگر کاربران پشت خط نمی‌مانند تا لیستی طولانی از شماره‌ها و کدهای مختلف را بشنوند. کاربران می‌توانند با ربات هوشتل تماس گرفته و خواسته خود را بیان کنند و جواب آن را نیز دریافت نمایند.

ایجاد مکالمه‌ی دو طرفه با کاربر

یکی از مزیت‌های پر رنگ و چشم‌گیر هوشتل ایجاد مکالمه‌ای دو طرفه با کاربر است. هوشتل با اتکا بر فناوری هوش مصنوعی می‌تواند با کاربر مکالمه بر قرار کند و محتوای صحبت‌های او را متوجه شود و به فراخور صحبت‌های او، در صورت نیاز، سوال‌های مرتبط بپرسد. هوشتل حتی می‌تواند متوجه شود که پاسخ چه سوال‌هایی در دایره اطلاعات و دیتای او قرار ندارد و تماس‌گیرنده را برای راهنمایی بیشتر به اپراتور انسانی ارجاع دهد.

کارهای دیگری که هوشتل علاوه بر پاسخگویی می تواند انجام دهد

علاوه بر مزیت‌هایی که هوشتل در رابطه با پاسخ‌دهی به مراجعه‌کنندگان مرکز تماس دارد، کارهای دیگری را نیز می‌تواند انجام دهد. شما می‌توانید از هوشتل برای نظرسنجی از مشتریانتان، ثبت شکایات آن‌ها و هم‌چنین مستند سازی از تماس‌های انجام شده در مرکز تماس استفاده کنید. در صورت نیاز نیز مدیران مراکز تماس می‌توانند از هوشتل برای مانینتورینگ مکالمه‌های انجام شده و کیفیت پاسخ‌دهی به مشتریان و … استفاده کنند.

چنانچه می خواهید از محصول هوشتل استفاده کنید و یا درخواست دموی این محصول را دارید، به اینجا مراجعه نمایید.

محمد بازدید : 23 یکشنبه 18 خرداد 1399 نظرات (0)
مترجم هوشمند مایکروسافت، یک قدم نزدیک‌تر به آینده

مترجم هوشمند مایکروسافت، یک قدم نزدیک‌تر به آینده

“چه می شود اگر نه فاصله و نه زبان مهم باشند؟ چه می شود اگر فناوری بتواند به شما کمک کند در هر کجا که نیاز دارید باشید و به هر زبانی صحبت کنید؟ با استفاده از فناوری هوش مصنوعی و تجربیات هولوگرافی این امر امکان پذیر است و قرار است تحول به پا کند.” این صحبت های جولیا وایت یکی از مدیران ارشد شرکت مایکروسافت است.

دوباره مایکروسافت با یک پروژه خارق العاده همه را غافلگیر کرد. فناوری جدید مایکروسافت که با نام AI neural TTS and holograms معرفی شده است، قادر است هولوگرامی از یک فرد بسازد که توانایی صحبت به هر زبان دلخواه را دارد و فرد می تواند این هولوگرام به هر جای دنیا که نیاز دارد ارسال کند.

AI-technology-microsoft-inspire

از این فناوری فوق العاده توسط جولیا وایت، یکی از مدیران ارشد شرکت مایکروسافت، در کنفرانس Microsoft Inspire 2019 رو نمایی شد. وایت صحبت های خود را با جملاتی شروع کرد که هم یکی از آرزوهای دیرینه انسان را بیان می کرد و هم  چشم انداز شرکت مایکروسافت در سال های آینده را برای حضار تشریح کرد.  این فناوری جدید مایکروسافت شاید بتواند سر آغازی برای رسیدن انسان به قدرت‌های جدید و خارق العاده ای باشد که سال ها نظاره‌گر آن در فیلم های تخیلی بوده‌ایم.

در حین سخنرانی، نسخه هولوگرامی وایت بر روی صحنه ظاهر شد و به زبان ژاپنی سخنرانی او را ادامه داد. این نسخه دقیقا با صدای خود او شروع به سخنرانی کرد و حالات او را در حین صحبت کردن تقلید می کرد. برای این کار مایکروسافت از قبل جولیا وایت را در استودیو واقعیت مختلط خود اسکن کرد و یک نسخه هولوگرامی دقیق از جولیا وایت را تولید کرد.

برای این کار مایکروسافت از از فناوری های Azure AI و تبدیل متن به گفتار neural استفاده کرد. پس از آن از صدای خام وایت استفاده شد تا این هولوگرام قادر باشد که با استفاده از مشخصات صحبت کردن او و امضای صوتی خود او صحبت کند. بااین کار صدای نسخه دیجیتال دقیقا مانند صدای خود وایت است و همان تغییرات آوایی و لحن صحبتی را دارد که خود وایت هنگام سخنرانی همان گونه سخنانش را ادا می کند.

microsoft-ai-hologram

مایکروسافت قبلا نیز از فناوری ساخت هولوگرام از افراد رونمایی کرده بود، اما اینکه به این فناوری قدرت ترجمه سخنان داده است جنبه کاربردی تر و گام فراتری است که تنها با استفاده از HoloLens امکان پذیر بود. در حال حاضر این فناوری یک نسخه اولیه می باشد اما تصور کنید که با پیشرفت این تکنولوژی قادر به انجام چه کارهایی خواهیم بود.

با این حال همین نسخه اولیه نیز چشم اندازی از آینده به ما می دهد که بسیار خارق العاده و جذاب است. بر کسی پوشیده نیست که این فناوری یک پیشرفت چشم گیر برای شرکت مایکروسافت به همراه خواهد داشت. قطعا این فناوری در آینده ای نزدیک بسیار پیشرفته تر و کاربردی تر و نه تنها به صورت یک اسکن از فرد با صحبت های از پیش تعیین شده خواهد بود.

محمد بازدید : 25 جمعه 16 خرداد 1399 نظرات (0)

اگر شما هم جزء افرادی هستید که به تایپ صوتی اندروید نیاز دارید، این مقاله برای شماست. در مقاله امروز قصد داریم تایپ صوتی را تعریف کنیم و کاربردها و نحوه دسترسی به این قابلیت را بیان کنیم. در ادامه با ما همراه باشید.

منظور از تایپ صوتی چیست؟

تایپ صوتی در حقیقت یکی از فناوری‌هایی است که زیر شاخه‌ای از کاربردهای فناوری شناسایی گفتار یا Speech Recognition و تبدیل گفتار به نوشتار محسوب می‌شود. تایپ صوتی در واقع کاربردی است که به ما این قابلیت را می‌دهد تا بتوانیم به کامپیوتر و یا گوشی هوشمندمان دیکته بگوییم. گوشی هوشمند و یا کامپیوتر نیز می‌توانند به کمک این فناوری هر آنچه که می‌شنود را تایپ کرده و به متن تبدیل کند.

تایپ صوتی در حقیقت به افراد کمک می‌کند تا بدون عمل تایپ کردن در کامپیوتر یا گوشی هوشمند بتوانند بنویسند. نرم افزارهایی که تایپ صوتی را انجام می‌دهند می‌توانند هر آنچه که به صورت صوت و یا گفت و گوی شفاهی می‌باشد را به متن قابل ویرایش تبدیل نمایند.

تایپ صوتی اندروید یعنی چه؟

منظور از تایپ صوتی اندروید اپلیکیشن یا سرویسی است که به طور اختصاصی عملیات تایپ صوتی را برای گوشی‌های هوشمند دارای سیستم عامل اندروید انجام می‌دهد. اپلیکیشن‌های بسیاری هستند که این عملیات را برای گوشی‌های اندرویدی انجام می‌دهند اما از بین نمونه‌های موجود در بازار تنها سرویس تاپی صوتی گوگل است که بر روی تعداد زیادی از زبان‌ها این سرویس را ارائه می‌دهد. سایر اپلیکیشن‌ها یا سرویس‌های تایپ صوتی معمولا بر روی یک یا تعداد بسیار محدودی زبان کاربرد دارند.

تبدیل گفتار به نوشتار آفلاین به کمک فارس آوا

کاربردهای تایپ صوتی اندروید چیست؟

به طور کلی کاربرد تایپ صوتی برای تبدیل گفتار به نوشتار می‌باشد و بر روی سیستم‌های اندروید نیز اینچنین است. ممکن است استفاده از تایپ صوتی بر روی گوشی‌های هوشمند کمی کاربرد خصوصی‌تری داشته باشد و کاربران می‌توانند از تبدیل گفتار به نوشتار برای کارهای روزمره و روتین خود همانند پیام دادن و یادداشت کردن استفاده نمایند. تایپ صوتی بر روی گوشی‌های اندرویدی به طور کلی دارای مزیت‌های زیر می‌باشد.

سرعت فوق‌العاده

قدرت تایپ کلمات یک فرد عادی بین 38 تا 40 کلمه در دقیقه می‌باشد که این تعداد به صورت میانگین برابر است با 2400 کلمه در ساعت. اگر به جای روش‌های تایپ قدیمی از تایپ صوتی مبتنی بر هوش مصنوعی استفاده شود این سرعت را می‌توان تا چیزی حدود 4 برابر افزایش داد. یعنی در هر دقیقه به صورت میانگین 150 کلمه.

دسترسی بالا

از آنجایی که تایپ صوتی بر روی پلتفرم‌های متفاوتی در دسترس است، در گوشی‌های هوشمند نیز می‌توان در هر کجا از آن استفاده کرد. دیگر لازم نیست همانند روش‌های قدیمی یک جا نشسته و ساعت‌ها به تایپ کردن مشغول شوید.

دقت بالا

یک تایپیست معمولی به صورت میانگین از هر 100 کلمه 8 کلمه را اشکال دارد. در صورتی که با استفاده از تبدیل گفتار به نوشتار میزان خطا تا حد زیادی کاهش میابد. زیرا به جای نوشتن کلمات با استفاده از کیبرد، کلمات مستقیما به سرویس هوش مصنوعی گفته شده و او نیز آن‌ها را به نوشته تبدیل کرده است.

چگونه به تایپ صوتی اندروید دسترسی پیدا کنیم؟

همانطور که بالاتر به آن نیز اشاره شد، برای استفاده از تایپ صوتی می‌توانید از اپلیکیشن و یا سرویس‌های مختلفی که در بازار وجود دارند بهره ببرید. مشکلی که در این زمینه وجود دارد آن است که کاربر فارسی زبان برای استفاده از تایپ صوتی تا حدودی با مشکل مواج است. زیرا به دلیل اینکه هوش مصنوعی و تبدیل گفتار به نوشتار در کشور حوزه بسیار جدید و نوپایی است محصولات محدودی در این زمینه وجود دارند و نمونه‌های خارجی مشابه نیز اکثرا بر روی زبان فارسی سرویسی ارائه نمی‌دهند.

چت با کامپیوتر به کمک چت بات ها

شاید بتوان گفت کاربر فارسی از بین سرویس‌های خارجی تنها می‌تواند از تایپ صوتی گوگل استفاده کند که آن هم در برخی اوقات کاربر را با مشکل مواجه می‌کند. زیرا که سرویس گوگل بر روی زبان فارسی متمرکز نشده و تنها گفتار عام زبان فارسی را می‌فهمد. لذا زمانی که کاربر با گویش خاص صحبت می‌کند و یا اصطلاحات خاصی به کار می‌برد این سرویس قادر به تشخیص نیست. لذا برای کاربران فارسی زبان بهتر است تا به سراغ سرویسی بروند که به طور اختصاصی بر روی زبان فارسی متمرکز باشد. خوشبختانه از بین نمونه‌های محدودی که در بازار داخلی وجود دارند موارد با کیفیت و کاربردی نیز پیدا می‌شوند.

آیا اپلیکیشن داخلی وجود دارد که تایپ صوتی اندروید تخصصی برای زبان فارسی انجام دهد؟

یکی از محصولاتی که به صورت تخصصی تایپ صوتی اندروید در زبان فارسی انجام می‌دهد، محصول فارس آوا شرکت عامر اندیش می‌باشد. به جرات می‌توان گفت این محصول یکی از با کیفیت‌های بازار حال حاضر ایران می‌باشد. محصول فارس آوا تبدیل گفتار به نوشتار را به صورت تخصصی برای زبان فارسی انجام می دهد و قادر است ارتباط کلامی بین شما و کامپیوتر یا موبایلتان را فراهم کند. محصول فارس آوا با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهره گیری از آخرین تکنولوژی های روز دنیا تولید شده است و به دلیل جمع آوری بزرگ ترین دیتاسِت موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهره مندی از تنوع گفتاری بسیار وسیع موفق شده است تا در رقابت با شرکت های بزرگی چون گوگل (بر روی زبان فارسی) دارای ضریب دقت بالایی باشد.

محصول فارس آوا دارای قابلیت های زیر می باشد:

  • تبدیل گفتار به متن فارسی با دقت و سرعت بالا
  • بهره مندی از آخرین تکنولوژیهای یادگیری عمیق
  • تبدیل گفتار به متن بصورت همزمان (Real-Time)
  • تشخیص گفتار و صوت در محیط های نویزی
  • پشتیبانی از انواع لهجه ها و گویش ها
  • قابلیت تبدیل گفتار محاوره ای به متن
  • پشتیبانی از انواع فرمتهای صوتی و ویدیویی
  • تبدیل گفتار انگلیسی به متن انگلیسی
  • غیر وابسته به گوینده و عدم نیاز به آموزش برای هر فرد
  • ارائه API محصول فارس آوا و SDK تبدیل گفتار به متن در قالب وب سرویس
  • ارائه پنل تحت وب برای آپلود کردن فایلها جهت پردازش
  • قابل نصب روی سرور مشتری و عدم نیاز اتصال به اینترنت
  • بهره مندی از دایره واژگان (فرهنگ لغت) بسیار وسیع
  • تبدیل گفتار به نوشتار به کمک هوش مصنوعی

با توجه به قابلیت های ذکر شده، محصول فارس آوا می تواند چنین کاربرد هایی داشته باشد:

  • امکان استفاده در تمامی سیستم های عامل (Android, IOS, Mac, Windows, Linux)
  • امکان استفاده برای تمامی برنامه های تحت موبایل (تمامی پلتفرمها)
  • امکان استفاده در برنامه هایی از قبیل دستیارهای شخصی هوشمند در موبایل
  • امکان استفاده های عمومی از قبیل : تایپ گفتاری و اجرای دستورات صوتی
  • امکان سفارشی سازی برای تشخیص دستورات خاص صوتی
  • امکان سفارشی سازی برای کاربردهای خاص و افزایش دقت
  • پردازش داده های حجیم گفتاری

علاوه بر آن فارس آوا دارای دو محصول جانبی می‌باشد که می‌تواند عملیات تبدیل متن به گفتار (TTS) و استخراج کلمات کلیدی (KWS) را انجام دهد. چنانچه قصد دارید با محصول فارس آوا بیشتر آشنا شوید به صفحه محصول فارس آوا مراجعه کنید و اگر درخواست دمو دارید به صفحه تماس با ما مراجعه نمایید.

محمد بازدید : 23 یکشنبه 11 خرداد 1399 نظرات (1)

 

سوپر هوش مصنوعی (Artificial Super Intelligence)

سوپر هوش مصنوعی (Artificial Super Intelligence)

همه ی ما به تدریج در دنیای دیجیتال به استفاده روزمره از هوش مصنوعی در زندگی، بدون اینکه متوجه باشیم، عادت کرده ایم. از دستیارهای هوشمند (همانند سیری و دستیار گوگل) گرفته تا الگوریتم هایی که در اپلیکیشن هایی که با آن ها کار میکنیم
پیشنهادات مختلفی به ما ارائه می دهند و ما روزانه از آن ها استفاده می کنیم هوش مصنوعی هستند. هوش مصنوعی روز به روز در حال پیشرفت و حل تسک های سخت تری می باشد. با وجود همه ی این پیشرفت ها، بشر هنوز نتوانسته است به نوعی از هوش مصنوعی دست یابد که برتر از هو ش انسانی باشد. این نوع از هوش مصنوعی که از آن به عنوان سوپر هوش مصنوعی یاد می شود، از دو نوع دیگر از هوش مصنوعی (یعنی هوش مصنوعی محدود و هوش مصنوعی عمومی) توانا تر خواهد بود و به سطحی از آگاهی خواهد رسید که هوش انسان نیز از داشتن آن عاجز است.

سوپر هوش مصنوعی به چه معنا است؟

سوپر هوش مصنوعی در واقع عبارتی است که به زمانی اشاره می کند که ماشین ها دارای هوش فرا بشری خواهند شد و در آن زمان یک ربات قادر خواهد بود که هوش انسانی را کنار بزند. “هوش مصنوعی” در واقع به توانایی ماشین ها به دنبال تقلید از روش فکر کردن انسان می باشد در حالی که “سوپر هوش مصنوعی” سطحی از هوش مصنوعی است که می تواند به راحتی هوش انسانی را کنار بزند و به سطحی بالاتر برسد. در حقیقت ادعا می شود که با دست یافتن به هوش مصنوعی توانایی درک و فهم ماشین ها از سطح انسان عبور خواهد کرد.

بیشتر متخصصان معتقدند که هنوز هیچ جامعه انسانی به سوپر هوش مصنوعی دست نیافته است. تلاش های مهندسان و دانشمندان علم هوش مصنوعی تا به حال برای رسیدن به نقطه ای بود که بتوان آن را هوش مصنوعی کامل نام نهاد، و در این نقطه ماشین ها به توانایی تفکر و سطح آگاهی مشابه به انسان می رسند. با این که پیشرفت هایی در این زمینه وجود داشته است (برای مثال ابر کامپیوتر IBM Watson که توانست در برنامه تلویزیونی Jeopardy که یک مسابقه پرسش و پاسخ بود افراد انسانی شرکت کننده در مسابقه را شکست دهد)، هیچ ماشینی تا به حال به سطحی از درک و شعور و وسعت دانش یک انسان بالغ نرسیده اند. آزمون تورینگ، که در چند دهه قبل بنا نهاده شد، هنوز هم برای این که بفهمیم یک ماشین تا چه حد در گفتار و تفکر به انسان شبیه است استفاده می شود و هنوز هیچ نوع از هوش مصنوعی و ماشین و سیستمی نتوانسته است این آزمون را پشت سر بگذارد.

hand-wrestling-between-human-and-robot

هرچند نظریه هایی وجود دارند که بیان می کنند که رسیدن به سوپر هوش مصنوعی از آن چه در ذهن افراد است زودتر اتفاق خواهد افتاد اما باز هم راه طولانی تا رسیدن به ماشین هایی با ذهنی فرا انسانی وجود دارد. با استفاده از نمونه های مانند قانون مور، که تراکم فزاینده ترانزیستور ها را پیش بینی می کند، و با اشاره به مسائلی مانند تکینگی و رشد چشم گیر و استثنائی فناوری، متخصصان اعتقاد دارند که انسان ها قادر به دستیابی به هوش مصنوعی کامل در آینده ای نزدیک خواهند بود و پس از آن سوپر هوش مصنوعی نیز خلق خواهد شد و بدین صورت در قرن بیست و یک می توانیم شاهد ظهور سوپر هوش مصنوعی باشیم.

رسیدن به سوپر هوش مصنوعی، آنچه انسان آن را می خواهد

به هر حال پیش بینی ها حاکی از آن است که در آینده سوپر هوش مصنوعی امکان پذیر خواهد بود، اما سوال اصلی این است که آیا مردم حاضرند تا آن را توسعه دهند و به زندگی خود راه دهند؟ جواب این سوال به طور قطع بله خواهد بود. با سرمایه گذاری ها و پیشرفت هایی که در زمینه فناوری شده است، شرکت های مدعی فناوری خواهان پیشرفت روز افزون و تولید محصولات بی همتا و سود آور خواهند بود. محصولاتی که هیچ یک از هم رقیبانشان آن را ارائه نداده باشد. پس قطعا کمپانی های بزرگ به دنیال خلق چنین محصول قدرتمندی خواهند بود و چه بسا سرمایه گذاری هایی بر روی دستیابی به آن انجام شده است.

در مقابل مردم نیز خواهان کامپیوترها و سیستم ها و برنامه های پیشرفته تر خواهند بود و تمام این پیشرفت ها تکنولوژی را در راه رسیدن به یک سیستم پیشرفته و متعالی قرار خواهد داد.

a-robot-thinking

بر فرض اینکه روزی انسان ها توانستند به سوپر هوش مصنوعی دست یابند، سوال این است که آیا باید از آن روز بترسیم؟ جواب این سوال تا حد زیادی به طرز تفکر و خوش بینی و یا بد بین بودن شما بر می گردد. تصور کنید که برای اداره جامعه به یک نیروی پیشرفته با ذهنی بسیار خارق العاده دسترسی داشته باشیم. نیرویی که می تواند برای حل مشکل ها و پر کردن خلاء های موجود راه حل های پیشرفته و متنوعی ارائه دهد و خیلی از کارهای دیگری که از توان بشر خارج است انجام دهد. آیا این به خودی خود ترسناک خواهد بود؟

 

 

اگر محتوا برای شما جالب بود آن را با دوستانتان به اشتراک بگذارید.

محمد بازدید : 23 سه شنبه 06 خرداد 1399 نظرات (0)
استفاده از هوش مصنوعی در مراکز تماس0

استفاده از هوش مصنوعی در مراکز تماس

امروزه دنیای دیجیتال به سرعت نور در حال تغییر و توسعه است و یکی از مهم ترین توسعه هایی که در آن اتفاق افتاده را می توان پیشرفت هوش مصنوعی در سال های اخیر دانست. در عصر جدید با استفاده از هوش مصنوعی ضمن اتوماسیون کردن بخش های به خصوصی از کسب و کارها و صنایع، با کاهش بسیاری از هزینه ها زمینه های رشد و پیشرفت در صنایع مختلف فراهم شده است. هوش مصنوعی و به خصوص یادگیری ماشینی در سال های اخیر راه خود را به مراکز تماس ها باز کرده اند، که باعث شده تا جایگزین بسیار مناسب و کاربردی برای نیروی کار انسانی در ارتباط با مشتریان و خدمات رسانی به آن ها باشد.

AI-agent-in-call-centers

در سال های اخیر بسیاری از کسب و کارها در سراسر جهان برای بخش خدمات مشتریان و مراکز تماس خود به هوش مصنوعی روی آورده اند و از سود و پیشرفت هایی که این زمینه جدید برای آن ها به ارمغان آورده است با آغوش باز استقبال نموده اند. با این حال لازم است که صاحبان کسب و کارهای مختلف با هوش مصنوعی و مزیت هایی که این فناوری برای آن ها به همراه خواهد داشت آشنا شوند.

هوش مصنوعی چیست؟

عبارت هوش مصنوعی (artificial intelligence) در واقع اولین بار طی ورکشاپ Dartmouth توسط دانشمندانی که بر روی راه هایی برای پیشرفت یادگیری ماشین کار می کرند، در سال 1955 ابداع شد. از حل کردن مسائل ریاضی ساده تا فهمیدن زبان طبیعی، همه ی این ها جز تسک هایی است که هوش مصنوعی توانسته در طی سال ها فرا بگیرد و انجام دهد و روز به روز بیشتر پیشرفت کند.

امروزه هوش مصنوعی به بخش مهمی از فناوری های دیجیتال تبدیل شده است. با شروع اتوماسیون کردن بخش های به خصوصی از کسب و کارها، از هوش مصنوعی نه تنها به عنوان جایگزینی برای نیروی کار انسانی استفاده شده است، بلکه باعث افزایش عملکرد سرویس های ارائه شده به مشتریان نیز شده است.

یکی از بخش های بخصوصی که هوش مصنوعی می تواند بسیار به پیشرفت آن کمک کند، مراکز تماس کسب و کارها هستند. هوش مصنوعی در مراکز تماس توانسته است سهم چشم گیری در بهبود تجربه مشتریان (customer experience) و کمک به کارمندان این مراکز داشته باشد. کاری که در زمان های گذشته صرفا توسط یک سری کارمند آموزش دیده انجام می شده امروزه با کمک هوش مصنوعی توانسته به سطح بسیار بالاتری از آن چه در گذشته بوده است برسد.

مزیت های هوش مصنوعی برای مراکز تماس

در پس پرده، هوش مصنوعی توانسته مزایای بسیار زیادی برای بخش خدمات مشتریان کسب و کارها به ارمغان بیاورد. هوش مصنوعی توانسته با آماده کردن جواب ها و در اختیار قرار دادن اطلاعات مورد نیاز در زمان بسیار کم برای کارمندان در زمان های تلف شده صرفه جویی کند. این امر باعث شده تا فرآیند سرویس های خدمات مشتریان بسیار کار آمد تر از قبل باشند. علاوه بر آن هوش مصنوعی مزایای دیگری برای مراکز تماس و بخش خدمات مشتریان کسب و کارها خواهد داشت که در ادامه به آن ها اشاره خواهد شد:

ساده و موثر کردن فرآیند: 

همان گونه که گفته شد هوش مصنوعی سهم به سزایی در موثر کردن فرآیند خدمات مشتریان و ساده کردن روند پاسخ به آن ها برای کارمندان مراکز تماس دارد و باعث شده تا مشتریان هر چه راحت تر به اطلاعات مورد نظر خود و جواب سوال هایشان برسند. هوش مصنوعی می تواند گستره ای از کارهای مربوط به خدمات مشتریان را به نحو احسن انجام دهد. از کنار هم گذاشتن اطلاعات مربوط به مشتریان و جواب دادن به سوال های آن ها، راهنمایی کردن افراد در راه درست و… تمام آن ها کارهایی است که هوش مصنوعی می تواند برای سرعت بخشیدن به روند کاری مراکز تماس انجام دهد.

درک صحبت های مشتریان در کسری از ثانیه: 

یکی از کارهایی که هوش مصنوعی در این زمینه انجام می دهد کاهش زمان مورد نیاز کارمندان مراکز تماس برای پاسخگویی به هر مشتری به صورت روزانه می باشد. هوش مصنوعی با دادن میزان قابل توجهی اطلاعات و جزئیات مورد نیاز برای پاسخگویی به هر مشتری زمان پاسخگویی به هر مشتری را کاهش می دهد (در زمان گذشته این روند با رجوع کارکنان به آموخته های قبلی و پاسخگویی به مشتری از دانسته ها صورت می گرفت که اکثر اوقات درصدی از خطا و طولانی شدن روند را به همراه داشت).

شناسایی زبان: 

این مزیت به طور قطع یکی از مهم ترین دستاورد های هوش مصنوعی خواهد بود. توانایی هوش مصنوعی برای شناخت زبان طبیعی و گویش های مختلف باعث شده تا فرآیند برقراری ارتباط با مشتریان با کمپانی ها بهتر انجام شود. با اتوماسیون شدن شناخت زبان طبیعی فرآیند ارتباط با مشتریان سرعت و کارایی بیشتری یافته است و به همین دلیل مشتریان می توانند راحت تر و سریع تر به جواب سوالات و اطلاعات مورد نیاز خود دست یابند و به درستی در صورت نیاز به بخش های مختلف هدایت شوند.

با پیشرفت های هوش مصنوعی در سال های گذشته، اپراتورهای هوش مصنوعی در مراکز تماس از صدای طبیعی برخوردار شده اند و بدون اینکه به مشتریان احساس صحبت با فردی غیر انسانی بدهد به پرسش و پاسخ و رفع نیازهای مشتریان بپردازد. با گذشت زمان نیز هوش مصنوعی در آینده ای نزدیک قادر خواهد بود تا به نحو احسن به ارتباط با مشتریان بپردازد و فرآیند خدمات به مشتریان را برای کمپانی های مختلف آسان تر کند.

استفاده از هوش مصنوعی برای مراکز تماس در ایران

در حال حاضر تنها شرکتی که در داخل کشور موفق به تولید اپراتوری هوشمند برای مراکز تماس و خدمات مشتریان و پشتیبانی آن ها شده است، شرکت عامر اندیش هوشمند می باشد. محصول تولیدی این شرکت که هوشتل نام دارد اپراتوری هوشمند مبتنی بر هوش مصنوعی می باشد که به نوعی جایگزینی برای اپراتورهای انسانی مراکز تماس خواهد بود. این محصول یک سامانه کامل برای برقراری ارتباط با مشتری به زبان فارسی و بروی بستر VOIP است که به صورت هوشمند صحبت های مشتری را شنیده و آن ها را تبدیل به متن کرده، سپس به پردازش متن های دریافتی پرداخته و در انتها پس از یافتن پاسخ مناسب، به مانند یک عامل انسانی آن را برای مشتری اعلام می کند.

محمد بازدید : 25 دوشنبه 29 اردیبهشت 1399 نظرات (0)

به این جمله دقت کنید:

“چت بات ها آینده ی brand engagement هستند و مشتریانی که با کسب و کار شما درگیر شده باشند به انتهای قیف فروش شما می رسند.”

اگر شما هم صاحب کسب و کاری هستید، قطعا می دانید رمز فروش بیشتر و داشتن سود همیشگی در یک کسب و کار، داشتن مشتریانی وفادار می باشد، و رمز بدست آوردن مشتریان وفادار هم قطعا تجربه خوب آن مشتریان از کسب و کار شما است.

مشتریان امروز یک کسب و کار نسبت به مشتریانی که پنج سال قبل داشت، هوشمند تر و باهوش تر شده اند و این مشتریان هوشمند از شما انتظار دارند که در برقراری ارتباط با آن ها و ارائه سرویس ها و خدماتتان ماهرانه تر و هوشمندانه تر عمل کنید.

بر اساس پیش بینی Gartner تا سال 2020 میلادی، ارتباط مشتریان با یک کسب و کار از روش هایی خواهد بود که نیروی انسانی در آن دخالتی نداشته باشد و ترجیح مشتریان به استفاده از پشتیبانی هایی است که به صورت خودکار جواب خواهند داد.

یکی از این پشتیبانی های خودکار محبوب، قطعا چت بات است که در آینده ای نزدیک ابزاری خواهد بود که ارتباط موثر با مشتریان را افزایش خواهد داد. قطعا چت بات ها یک ابزار کاربردی در ایجاد یک تجربه کاربری عالی برای مشتریان خواهد بود. با استفاده درست و موثر از چت بات های هوشمند قطعا می توانید فروش خود را بالا برده و ارتباط عمیق تری را با مشتریانتان بسازید. چت بات ها به مشتریان شما کمک می کنند که با استفاده از مکالمه راحت تر با برند شما ارتباط برقرار کنند.

 

چت بات ها به سرعت سوال های کاربران را پاسخ می دهند

 

تا به حال حتما برای شما هم پیش آمده که در تماس با بخش پشتیبانی یک کسب و کار جواب گرفته اید که انجام کار شما یا جواب دادن به سوال شما چند روز کاری زمان خواهد برد؟ یا در برخی اوقات هم پس از گذشت چند روز خبری از انجام کار و یا دادن پاسخ به شما نیست؟ به عنوان یک مدیر یا صاحب یک کسب و کار یا سازمان می دانید که چنین امری چقدر به کسب و کار و بیزینس شما ضرر می رساند. مشتریان شما به دنبال یک جواب سریع هستند و توقع دارند که اگر برای انجام کاری با بخش پشتیبانی کسب و کارتان تماس گرفته اند هر چه سریع تر به کارشان رسیدگی شود.

روش های قدیمی پاسخدهی و ارائه خدمات و پشتیبانی از مشتریان نمی تواند به درستی پاسخگوی این نیاز باشند. برای سرعت بخشیدن به روند پاسخگویی به مشتریان نیاز دارید تا سیستمی داشته باشید که بتواند در لحظه پاسخگوی مشتریان شما باشد. چه سیستمی بهتر از چت بات هایی که در آن واحد و بدون هیچ درنگی می توانند به مشتریان شما پاسخ دهند؟

زمانی که یک مشتری به بخش پشتیبانی شما مراجعه می کند و با چت باتی به گفت و گو می پردازد، حتی اگر نتواند پاسخ مورد نظر را در همان زمان دریافت کند، خوشامدگویی گرم چت بات و اینکه قابلیت آن را دارد که زمانی که نتوانست راه حلی برای مشکلش ایجاد کند زمان دقیق رسیدگی به مشکل را به او می گوید، باعث می شود که مشتری راضی از نزد شما باز گردد.

 

چت بات ها می توانند میزان engagement مشتریان با کسب و کار شما را افزایش دهند

 

همان طور که در اول مقاله نیز گفته شد چت بات ها brand engagement (درگیری مخاطب با برند) شما را افزایش خواهند داد و مشتریان بیشتری را به سمت انتهای قیف فروش شما هدایت خواهد کرد، زیرا مشتری ای که با کسب و کار شما درگیر شده باشد اشتیاق بیشتری برای خرید از شما خواهد داشت.

 

با کمک چت بات ها می توانید در هزینه های بخش پشتیبانی کسب و کارتان صرفه جویی کنید

 

لازم به ذکر است که یک چت بات ساده قادر است کار چند نیروی انسانی را به صورت همزمان در بخش پشتیبانی انجام دهد. به همین دلیل با استفاده از چت بات می توانید تعداد نیروهای انسانی بخش پشتیبانی خود را کاهش دهید و اگر به دنبال راهی برای کاهش هزینه های بخش پشتیبانی کسب و کارتان در طولانی مدت هستید، می توانید از چت بات ها استفاده کنید.

بر اساس گزارش های تحقیق جدیدی با عنوان “Chatbots: خرده فروشی ، تجارت الکترونیک ، بانکداری و بهداشت و درمان 2017-2022″ ، چت بات ها تا سال 2022 می تواند بالغ بر 8 میلیارد دلار در سال در هزینه های کسب و کارها صرفه جویی کند.

 

چت بات ها می توانند به صورت 24/7 به مشتریان کسب و کارها خدمات ارائه دهند

 

همان طور که قبلا نیز اشاره کردیم، مشتریان کسب و کار علاقه دارند که اطلاعاتی را که نیاز دارند در همان لحظه دریافت کنند اما روش های قدیمی پشتیبانی از مشتریان دارای خلاء هایی است که نمی تواند این مورد را به طور کامل پوشش دهد. استفاده از چت بات ها گزینه بسیار مناسبی برای رفع این نیاز مشتریان در بخش پشتیبانی می باشد. چت بات ها قادر هستند 24 ساعت هر 7 روز هفته در دسترش مشتریان باشند و در هر ساعت از شبانه روز از روزهای تعطیل و غیر تعطیل به سوالات و درخواست هایشان پاسخ دهند.

با استفاده از چت بات ها خطاهای انسانی را کاهش دهید

گاهی ممکن است در روند پاسخ به مشتری نیروی انسانی دچار خطا شود و یا اینکه به دلیل خستگی و… نتواند به درستی پاسخگوی نیاز او باشد و یا اینکه به دلیل تعدد وظایف رسیدگی به درخواست یک مشتری را فراموش نماید. اما چت بات ها هیچگاه خسته نمی شوند و چیزی را فراموش نمی کنند. به همین دلیل استفاده از چت بات ها باعث می شود تا خطاهای انسانی کاهش یابد.

محمد بازدید : 35 سه شنبه 23 اردیبهشت 1399 نظرات (0)
هوش مصنوعی عمومی Artificial General Intelligence چیست؟

هوش مصنوعی عمومی Artificial General Intelligence چیست؟

یک هوش مصنوعی عمومی در واقع ماشینی است که می تواند دنیای اطراف خود را همانند یک انسان درک کند و دارای ظرفیت و گنجایش مشابه برای انجام تسک ها و کارهای مختلف می باشد. در حال حاضر هوش مصنوعی عمومی وجود ندارد اما می توانیم رد پای آن را در داستان های تخیلی از قرن پیش مشاهده کنیم و در فیلم های مانند 2001:اودیسه فضایی ببینیم..

داستان های تخیلی و فیلم هایی که راجب هوش مصنوعی وجود دارند به طور گسترده ای با آن چه در واقعیت وجود دارد متفاوت هستند، البته بیشتر آن ها علاقه دارند تا ذهن ها را به سمت تصور نابجا در مورد ماشین های هوشمندی که قرار است انسان ها را ریشه کن کنند و یا به بردگی بکشند، ببرند. در چنین داستان هایی ، هوش مصنوعی عمومی اغلب به شکل موجودی بی تفاوت نسبت به درد و رنج انسان یا حتی کسی که خواهان نابودی بشر هستند تصویر می شوند.

در مقابل چنین تصوری، رمان ها و داستان هایی نیز وجود دارند که هوش مصنوعی عمومی را به عنوان متولیان خیر و خوبی نمایش می دهند که جوامع را با عدالت اداره می کنند و رنج ها را از بین می برند و آن را تبدیل به جایی می کنند که ساکنانش می توانند با شور و شوق و با یک سرعت نفس گیر به پیشرفت خود ادامه دهند.

این که این تصورات تا چه میزان نزدیک به هوش مصنوعی عمومی است و یا چه میزان با دنیای واقعی ارتباط دارد، به دلیل اینکه هنوز نتوانسته ایم به چنین چیزی به طور کامل دست پیدا کنیم در هاله ای از ابهام وجود دارد و هیچ کس نمی تواند به قطعیت بگوید خوب است یا بد. اما در هر صورت علم در دنیا دارد به سمتی می رود که روزی یک ماشین بتواند همانند انسان فکر کند و تصمیم بگیرد و عمل کند.

یک هوش مصنوعی عمومی چه کاری می تواند انجام دهد؟

از نظر تئوری یک هوش مصنوعی عمومی می تواند تمام کارهایی که یک انسان انجام می دهد را به طور کامل اجرا کند همین طور بسیاری از کارهایی که انسان از پس آن ها بر نمی آید. می توان گفت هوش مصنوعی عمومی حداقل می تواند همانند انسان عمل کند، تفکر و استدلال انعطاف پذیرداشته باشد و کارهای محاسباتی انجام دهد.

باید بدانیم که با این سطح از آگاهی و دانش یک ماشین یا دستگاه می تواند هر تسک و کاری که بر انسان محول می شود را به شیوه آن انجام دهد و با گذشت زمان نیز هوش مصنوعی می تواند تمام نقش های مختلف انسان را به راحتی اجرا کند. در ابتدای این راه ممکن است نیرو کار انسانی ارزان تر از نیرو کار هوش مصنوعی باشد و یا ممکن است نیرو انسانی و هوش مصنوعی در کنار یک دیگر کار کنند اما کم کم با پیشرفت هوش مصنوعی، هوش مصنوعی نیروی کار انسانی را به کنار می راند.

این خاتمه دادن به نیاز حضور نیروی انسانی هم جنبه های مثبت و هم جنبه های منفی در زندگی اجتماعی و سایر وجوح زندگی انسان ها خواهد داشت و باید از این نظر از ابتدا برای آن تفکر شود تا باعث به وجود آمدن معضل نشود.

امروزه که بحث ها در زمینه هوش مصنوعی عمومی و محدود و کاربرد های آن بالا گرفته است برخی خواستار جدی شدن مبحث معرفی درآمد عمومی جهانی (UBI) هستند. بر طبق این مبحث دولت ها موظف خواهند بود تا به طور مستمر به شهروندان حقوق بدهند.

گذشته از تاثیرات منفی ای که تصور می شود هوش مصنوعی عمومی به همراه داشته باشد، ظهور این نوع هوش مصنوعی می تواند بسیار مفید باشد. تصور کنید که جمعیتی از دانش با بهترین و درخشان ترین ذهن ها به توسعه فن آوری و تولید بپردازند و در چنین شرایطی بسیاری از مشکل هایی که در حال حاضر انسان با آن ها دست و پنجه نرم می کند، مانند تغییرات شدید آب و هوایی، رفع خواهد شد.

در سطح عادی، چنین سیستم هایی می توانند کارهای عادی تر و روزمره را انجام دهند، از کارهای ساده مانند رانندگی اتومبیل تا کارهایی مانند تشخیص پزشکی و عمل جراحی را انجام دهد و در بخش های مهم مربوط به مال و جان انسان ها بسیار مفید باشد.

آیا هوش مصنوعی عمومی می تواند به هوش ابر انسانی برسد؟

بله، چنین هوشی نه تنها از توانایی های کلی انسانی برخوردار است بلکه می تواند تمام مزایایی که کامپیوتر و ماشین ها نسبت به انسان دارد را در بهترین سطح دارا باشند.

چه زمانی انسان ها به هوش مصنوعی عمومی دست پیدا می کنند؟

با توجه به اینکه از چه کسی چنین سوالی می پرسید پاسخ سوالتان از 11 سال دیگر تا هیچ زمانی متفاوت خواهد بود. یکی از دلایل آن است که چنین سیستمی به سختی قابل پیاده سازی می باشد. امروزه بیشتر سیستم های مبنی بر هوش مصنوعی به صورت خدمات آنلاین هستند و سیستم هایی می باشند که می توانند زبان را بشناسند، گفتار را بفهمند و تشخیص چهره و عکس و فیلم  داشته باشید و بتواند آن را تجزیه و تحلیل کند. این پیشرفت های ساده در هوش مصنوعی و کمک هایی که به توسعه و پیشرفت می کنند می تواند چشم انداز مثبتی از هوش مصنوعی عمومی را در اختیار بشریت قرار دهند.

با این حال سیستم های هوش مصنوعی که امروزه مورد استفاده قرار می گیرند بسیار ساده و تک محوری هستند و تنها می توانند از پس یک تسک محول شده بر آیند که این کار نیز پس از آموزش های گسترده قابل اجراست و برای کار دیگری نمی توان از آن ها استفاده کرد. ماهیت این نوع از هوش مصنوعی (هوش مصنوعی عمومی) در واقع هوشی است که بتواند هر تسکی که به آن محول می شود را انجام دهد و در واقع هوش مصنوعی محدود پله ای کوچک برای رسیدن به آن است.

منبع: zdnet.com

اگر به این مطلب علاقه داشتید، آن را با دوستان خود به اشتراک بگذارید.

محمد بازدید : 39 سه شنبه 16 اردیبهشت 1399 نظرات (0)
هوش مصنوعی محدود (artificial narrow intelligence)
۱۳۹۸-۰۸-۲۶0

 

هوش مصنوعی محدود (artificial narrow intelligence)

هوش مصنوعی محدود نوعی از هوش مصنوعی است که در آن یک فناوری نسبت به انسان در تسک تعریف شده خاصی بهتر عمل می کند. بر خلاف هوش مصنوعی عمومی ، هوش مصنوعی محدود بر زیر مجموعه واحد از توانایی ها و پیشرفت های شناختی در یک کار بخصوص تمرکز دارد.

تعریف هوش مصنوعی محدود

در تاریخچه هوش مصنوعی ، هوش مصنوعی محدود بسیار زودتر از انواع دیگر هوش مصنوعی پدید آمده است. ممکن است بنظر برسد  که برخی از اولین سیستم های رایانه ای نیز از انسان ها در نوع خاصی از محاسبات و کارهای کمیتی ، بهتر عمل کرده است. بنابراین ممکن است تصور شود که آن فناوری ها باعث به وجود آمدن هوش مصنوعی محدود شده اند.

این روزها نمونه های هوش مصنوعی محدود زیاد است. رایانه ها در بازی های پیچیده ای مانند شطرنج ، تصمیم گیری هوشمندانه در زمینه تجارت و در انواع دیگر کارهای مفید و برجسته توانسته اند از انسانها پیشی بگیرند و بسیار خوب عمل کنند. با توجه به این موضوع ، جامعه فناوری به سمت تکامل سیستم های هوش مصنوعی گسترده تر و عمومی تر پیش می رود.

هوش مصنوعی محدود یک هدف آسان تر بود ، و هنوز بحث زیادی در مورد اینکه چگونه کامپیوترها با توجه به پیچیدگی مغز انسان قادر به برتری در هوش مصنوعی به طور کلی خواهند بود ، وجود دارد. با این حال ، پدیده هایی مانند پیشرفت هایی که در پردازش زبان طبیعی صورت گرفته است به رایانه ها امکان نوشتن اخبار و رمان های داستانی را می دهند ، و به ایده آل های انسان درباره آنچه می تواند الگوی هوش مصنوعی عمومی باشد ، نزدیک می شوند.

تفاوت بین هوش مصنوعی محدود و عمومی

هوش مصنوعی ضعیف جایی است که ما در حال حاضر در آن قرار داریم و هوش مصنوعی عمومی آینده ای است که می خواهیم به آن برویم. هوش مصنوعی محدود به نوعی از هوش مصنوعی اطلاق می شود که قادر است تنها یک کار خاص را انجام دهد. یک فیلترینگ اسپم یا لیست پخش پیشنهادی از Spotify یا حتی یک اتومبیل خود ران- که همه کاربردهای فناوری پیشرفته به حساب می آیند- جز هوش مصنوعی محدود دسته بندی می شود. حتی واتسون ، ابر رایانه رسانه ای IBM که می تواند متخصصان انسانی را مغلوب خود کند فقط نمونه ای از هوش مصنوعی محدود می باشد.

هوش مصنوعی محدود به این معنا است که در آن سیستم هوش مصنوعی میزان خاصی از هوش را در یک زمینه خاص به کار برده می شود ، اما این سیستم تنها رایانه یا ماشینی است که وظایف بسیار تخصصی و محدود را برای انسان ها انجام می دهد.

هوش مصنوعی عمومی بسیار پیچیده تر است. این واژه به سیستمی اطلاق می شود که قادر به مقابله با هر کار کلی است که از آن خواسته می شود ، دقیقاً همانند یک انسان. ایده آل هوش مصنوعی عمومی آن است که این سیستم توانایی های شناختی و درک تجربی کلی از محیط هایی که در آن قرار دارد را به همراه توانایی پردازش این داده ها با سرعت بسیار بیشتر از انسان ها داشته باشند.

از این رو نتیجه می گیریم که این سیستم ها در بعد دانش ، توانایی شناختی و سرعت پردازش از نظر انسانی قوی تر می شوند و لحظه ای همه چبز جالب تر می شود که بدانیم این هوش برتر در حقیقت ساخته همان انسان است. یکی از این موارد همان چیزی است که ریموند کورزویل ، مدیر مهندسی Google ، از آن به عنوان “تکینگی” یاد می کند.

از نظر کورزویل ، تا سال 2029 سیستم هوش مصنوعی آزمایش سنتی تورینگ را پشت سر می گذارد و به سطح هوش انسانی خواهد رسید. او تا سال 2045 پیش بینی می کند که تکینگی تکنولوژیکی رخ خواهد داد و در آن انسان قادر خواهد بود تا نئوکورتکس خود را به نوعی از سیستم ذخیره سازی – به احتمال زیاد مبتنی بر فضای ابری یا احتمالاً متصل به dna – مجهز کند و قادر به ادغام این نئوکورتکس با تقویت کننده هوش مصنوعی باشد. در اصل ، نهادهای هوش مصنوعی با آگاهی انسانی ادغام می شوند و فواید شناختی برای گونه های انسانی به ارمغان می آورند.

کاربردهای هوش مصنوعی محدود

از هوش مصنوعی محدود می توان در زمینه های زیر استفاده کرد:

  • اتومبیل های خود ران که یاد می گیرند چگونه رانندگی کنند مانند اتومبیل های گوگل و Uber ، که هم اکنون نیز وجود دارند.
  • تشخیص چهره در دفاتر بانکی که می تواند به شما در انجام کارهای شخصی کمک کند.
  • با توجه به تمام اطلاعات مالی شما فرم مالیاتتان را تکمیل می کند.
  • یک ربات که با توجه به ترجیحات قبلی شما ، پروازها و هتل های مورد نظرتان را برای شما رزرو می کند.
  • برنامه ریزی مجازی که دست راست شما برای مدیریت برنامه هایتان و گردهمایی های شما خواهد بود.
  • ایجاد لیست پخش موسیقی شخصی برای شما که بر اساس روال تمرینات ورزشی روزانه و غیره است.

این زیر مجموعه های هوش مصنوعی ، که ممکن است در تشخیص صدا و درک لهجه های رایج مانند دستیاران فردی مانند Siri و Cortana باشد ، می توانند با یادگیری ماشین و یادگیری عمیق به کمک شما بیایند و از کیفیت بسیار بالایی برخوردار هستند تا بتواند تحلیلی عظیم و اطلاعات ساختاری در نظر گرفته شده را برای شما انجام دهند.

 

منبع: ZDnet.com

محمد بازدید : 25 سه شنبه 09 اردیبهشت 1399 نظرات (0)
تعریف یادگیری عمیق

تعریف یادگیری عمیق

یادگیری عمیق نوعی از یادگیری ماشین و هوش مصنوعی است که در واقع از روشی که ذهن انسان برای یادگیری موضوع خاصی به کار می گیرد، تقلید می کند. این نوع از یادگیری یکی از عناصر مهم در علم داده می باشد که شامل آمار و مدل سازی پیش بینی است. یادگیری عمیق برای دانشمندان داده که وظیفه جمع آوری ، تجزیه و تحلیل و تفسیر مقادیر زیادی از داده ها را دارند ، بسیار مفید است و این روند را سریعتر و آسان تر می کند.

به نوعی می توان گفت یادگیری عمیق در واقع همان یادگیری ماشین است به گونه ای که در سطح کارهای پیچیده، نمایش یا انتزاع، یادگیری را برای ماشین انجام می دهد و به این صورت ماشین درک بهتری از واقعیت های وجودی پیدا می کند و می تواند الگو های مختلف را شناسایی کند. در ساده ترین سطح، یادگیری عمیق را می توان راهی برای خودکار سازی تجزیه و تحلیل پیش بینی ها دانست. الگوریتم های یادگیری عمیق در سلسله مراتب افزایش پیچیدگی و انتزاع قرار دارند در حالی که یادگیری ماشین سنتی بصورت خطی است.

برای فهم بهتر یادگیری عمیق، یک کودک نوپا را در نظر بگیرید که اولین کلمه ای که یاد گرفته “سگ” است. روشی که این کودک یاد گرفته که یک موجود “سگ” هست یا نه، آن است که به موجود اشاره می کند و کلمه “سگ” را می گوید. در این زمان والدین او می گویند ” بله آن یک سگ است” یا ” نه آن سگ نیست”. هرچه بیشتر این کودک به موارد مختلفی اشاره کند، بیشتر می فهمد چه نوع موجوداتی جز کلمه “سگ” دسته بندی می شوند. کاری که این کودک  نوپا انجام می دهد  بدون اینکه خودش بداند، در حقیقت به نوعی مشخص کردن یک مفهوم پیچیده است -تعریفی از یک سگ- با ساختن سلسه مراتبی است که در آن هر سطح انتزاعی با دانش ایجاد می شود که آن هم به نوبه خود از سلسه مراتب قبلی بدست آمده است و این کار همانند فرآیند یادگیری عمیق است

یادگیری عمیق چگونه کار می کند

برای شناسایی نحوه یادگیری عمیق باید با شبکه های عصبی آشنا باشید. این نوع یادگیری در واقع همان یادگیری به وسیله شبکه های عصبی ای هستند که دارای لایه پنهان زیادی می باشند و هر چقدر در این لایه ها جلو تر بروید به مدل های پیچیده تر و کامل تری می رسید.

یادگیری عمیق در عصر دیجیتال تکامل پیدا کرده است، و این امر باعث شده تا به انفجاری از داده ها در اشکال مختلف در همه ی دنیا داشته باشیم. این دیتا ها که به کلان داده معروف هستند، از منابع متفاوتی مانند شبکه های اجتماعی، موتورهای جست و جوی اینترنت، پلتفورم های تجارت الکترونیکی و… بدست می آیند.

با این حال این نوع داده، که معمولا بدون ساختار هستند، آنقدر وسیع است که شاید برای انسان چندین دهه طول بکشد تا بتواند آن را درک کند و اطلاعات مربوط به این داده ها را استخراج کند. کسب و کارهای مختلف به پتانسیل های بیشمار و باور نکردنی حاصل از این انبوه از اطلاعات پی برده اند و هر روز شاهد کسب و کارهایی هستیم که خود را با هوش مصنوعی سازگار کرده و آن را به دل کسب و کارهای خود می آورند، بخصوص برای اتوماسیون کردن پشتیبانی مشتریان خود.

متد های یادگیری عمیق

متدهای مختلف و متفاوتی برای به وجود آوردن مدل های یادگیری عمیق وجود دارند. این تکنیک ها و متد ها شامل روش های زوال و فروپاشی نرخ یادگیری، انتقال یادگیری، آموزش از طریق چرک نویس ها و داده های از قلم افتاده است.

زوال نرخ یادگیری :

نرخ یادگیری در واقع یک فرا پارامتر محسوب می شود (عملی که یک سیستم را تعریف می کند و یا قبل از فرآیند یادگیری شرایط عملکرد آن را تعیین می کند) که هر بار مقدار تغییرات مدل در پاسخ به اندازه گیری و خطای تخمین زده شده را کنترل می کند. نرخ یادگیری که بیش از حد بالا باشد ممکن است باعث شود فرآیند یادگیری ناپایدار باشد و یا اینکه یادگیری پایین تر از حد مطلوب و استاندارد صورت بگیرد. نرخ یادگیری هایی که بسیار اندک هستند نیز ممکن است فرآیند یادگیری را طولانی کنند که ممکن است باعث گیر افتادن شود.

روش زوال نرخ یادگیری (که به نرخ یادگیری با دوام و یا نرخ یادگیری منطقی نیز شناخته می شود) فرآیندی است برای سازگاری نرخ یادگیری به منظور افزایش کارایی به همراه کاهش زمان آموزش. ساده ترین و رایج ترین روش سازگاری میزان نرخ یادگیری در طول آموزش و شامل تکنیک هایی برای کاهش سرعت یادگیری در طول زمان است.

یادگیری جایگزین:

این فرآیند شامل بهسازی مدلی است که از قبل آموزش دیده است و نیاز به یک رابط کاربری داخلی یک شبکه پیش بینی شده دارد. اول ، کاربران داده های جدید شبکه موجود را که حاوی طبقه بندی های قبلی ناشناخته است ، تغذیه می کنند. پس از ایجاد تنظیمات در شبکه ، می توان کارهای جدیدی را با قابلیت طبقه بندی خاص تر انجام داد. این روش این مزیت را دارد که نیاز به داده های بسیار کمتری نسبت به سایرین دارد ، بنابراین زمان محاسبه را به دقیقه یا ساعت کاهش می دهد.

یادگیری از چرک نویس ها:

این روش به یک توسعه دهنده نیاز دارد تا یک مجموعه داده بزرگ برچسب دار را جمع کند و یک معماری شبکه را تنظیم کند که بتواند ویژگی ها و مدل را بیاموزد. این تکنیک به خصوص برای برنامه های جدید و همچنین برنامه های کاربردی با تعداد زیادی دسته بندی خروجی مناسب است. با این حال ، به طور کلی ، این رویکرد کمتر متداول است ، زیرا به مقادیر بسیار زیادی از داده ها نیاز دارد و باعث می شود روزها یا هفته ها آموزش طول بکشد.

حذفی ها و از قلم افتادگی:

در این روش سعی شده تا مشکل آموزش بیش از حد اتصالات در شبکه هایی با مقادیر زیادی پارامتر با رها کردن تصادفی واحدها و اتصالات آنها از شبکه عصبی در حین آموزش حل شود. ثابت شده است که این می تواند عملکرد شبکه های عصبی را بر روی تسک های یادگیری نظارت شده در زمینه هایی مانند تشخیص گفتار ، طبقه بندی اسناد و… بهبود بخشد.

یادگیری عمیق چه استفاده ای دارد؟

امروزه موارد استفاده از یادگیری عمیق شامل انواع برنامه های کاربردی تجزیه و تحلیل داده های بزرگ ، به ویژه مواردی است که در پردازش زبان طبیعی ، ترجمه زبان ، تشخیص پزشکی ، سیگنال های معاملات سهام بورس ، امنیت شبکه و تشخیص تصویر شده اند.

استفاده هایی که در حال حاضر از یادگیری عمیق می شود شامل موارد زیر است:

  • تجربه ی مشتری. مدل های یادگیری عمیق قبلاً برای چت روم ها استفاده می شدند. و همچنان که به تکامل خود ادامه می دهد ، انتظار می رود که یادگیری عمیق در مشاغل مختلف به منظور بهبود تجربیات مشتری و افزایش رضایت مشتری اجرا شود.
  • تولید متن. به ماشين ها دستور زبان و سبك يك متن داده مي شود و سپس از اين مدل استفاده مي كنند تا بطور خودكار متني كاملاً جديد متناسب با املای مناسب ، دستور زبان و سبك متن اصلي را بسازد.
  • هوافضا و نظامی. از یادگیری عمیق برای شناسایی اشیاء از ماهواره هایی که مناطق مورد نظررا شناسایی می کنند ، و همچنین برای تشخیص مناطق امن یا نا امن برای سربازان استفاده می شود.
  • اتوماسیون صنعتی. یادگیری عمیق با ارائه خدماتی که به طور خودکار در نزدیکی یک کارگر یا شیء به ماشین نزدیک می شود ، ایمنی کارگران را در محیط هایی مانند کارخانه ها و انبارها بهبود می بخشد.
  • اضافه کردن رنگ. با استفاده از مدل های یادگیری عمیق ، می توان رنگ ها و عکس ها و فیلم ها را به تصاویر های سیاه و سفید اضافه کرد. در گذشته ، این یک فرایند دستی بسیار وقت گیر بود.
  • تحقیقات پزشکی. محققان سرطان به عنوان روشی برای تشخیص خودکار سلول های سرطانی ، از یادگیری عمیق را در کارهای خود استفاده می کنند.
  • دید رایانه ای. یادگیری عمیق باعث افزایش چشم انداز رایانه شده است ، و دقت بالایی برای رایانه ها در تشخیص اشیاء و طبقه بندی تصویر ، ترمیم و تقسیم بندی فراهم می کند.

یادگیری عمیق در مقابل یادگیری ماشین

یادگیری عمیق زیر مجموعه ای از یادگیری ماشین است که که وجه تمایز آن روش حل مشکلات است. یادگیری ماشین برای شناسایی بیشتر ویژگی های کاربردی به یک متخصص دامنه نیاز دارد. از طرف دیگر ، یادگیری عمیق ویژگی ها را به صورت تدریجی فرا می گیرد ، بنابراین نیاز به تخصص دامنه را از بین می برد. این امر باعث می شود الگوریتم های یادگیری عمیق نسبت به الگوریتم های یادگیری ماشین که فقط به چند ثانیه تا چند ساعت زمان نیاز دارند ، زمان بیشتری برای آموزش نیاز داشته باشند. با این حال ، در هنگام آزمایش ، برعکس صادق است. الگوریتم های یادگیری عمیق نسبت به الگوریتم های یادگیری ماشین که زمان آزمون به همراه اندازه داده ها افزایش می یابد ، زمان کمتری برای اجرای تست ها می گیرند.

بعلاوه ، یادگیری ماشینی به همان ماشینهای پرهزینه و پرمصرف و GPU هایی با کارایی بالا نیاز ندارد که یادگیری عمیق یه همه ی آن ها نیاز دارد.

در پایان ، بسیاری از دانشمندان داده ها به دلیل تفسیر برتر آن ، یا توانایی در درک راه حل ها ، یادگیری ماشین سنتی را از طریق یادگیری عمیق انتخاب می کنند. همچنین الگوریتم های یادگیری ماشین نیز وقتی داده های کوچک هستند ترجیح داده می شوند.

مواردی که یادگیری عمیق ترجیح داده می شود شامل موقعیت هایی است که مقدار زیادی از داده ها وجود دارد ، مانند عدم درک دامنه برای درون نویسی ویژگی ها یا مشکلات پیچیده ، مانند تشخیص گفتار و پردازش زبان طبیعی.

 

منبع: techtarget.com

 

چنانچه این محتوا برای شما جذاب بود آن را با دوستان خود به اشتراک بگذارید.

محمد بازدید : 23 سه شنبه 02 اردیبهشت 1399 نظرات (0)
یادگیری ماشین چیست؟ تعریف ساده

یادگیری ماشین چیست؟ تعریف ساده

یادگیری ماشین (Machine Learning) یکی از زیر مجموعه های هوش مصنوعی است که به سیستم ها این امکان را می دهد تا به صورت خودکار یادگیری و پیشرفت داشته باشند بدون اینکه به برنامه نویسی صریحی برای آن داشته باشند. تمرکز اصلی یادگیری ماشینی بر توسعه برنامه های رایانه ای است که بتوانند به داده ها دسترسی پیدا کنند و از آن برای یادگیری خود استفاده کنند.

فرآیند یادگیری با مشاهدات یا داده ها آغاز می شود، مانند مثال ها، تجارب مستقیم و یا دستور العمل ها، تا به یک الگو در داده ها برسند و بر اساس این مثال هایی که ارائه می دهیم، تصمیمات بهتری بگیرند. هدف اصلی آن است که به کامپیوتر این اجازه را بدهیم که بدون دخالت و کمک انسان به طور اتوماتیک یادگیری داشته باشند و بتوانند اقدامات خود را بر مطابق با آن تنظیم کنند.

machine-learning

مفهوم ساده یادگیری ماشین

الگوریتم های بسیار مختلفی برای یادگیری ماشین وجود دارد و هر روزه صدها الگوریتم جدید نیز تولید می شوند، و به طور معمول توسط سبک یادگیری (learning style) (مانند یادگیری نظارت شده، یادگیری بدون نظارت، یادگیری نیمه نظارت) و یا با توجه به شباهتشان در فرم و عملکرد ( مانند طبقه بندی، برگشت، درخت تصمیم گیری، دسته کردن، یادگیری عمیق و…) گروه بندی می شوند. صرف نظر از سبک یادگیری یا عملکرد، تمام الگوریتم های یادگیری ماشینی به شرح زیر هستند:

  • نمایش: مجموعه ای از طبقه بندی کننده ها یا زبانی که کامیوتر آن را می فهمد.
  • ارزشیابی:  همچنین معروف به عملکرد هدف/نمره دهی.
  • بهینه سازی: روش جست و جو؛ اغلب طبقه بندی کننده ای با بالاترین امتیاز.

 هدف اساسی الگوریتم های یادگیری ماشین ، تعمیم یادگیری ها به فراتر از نمونه های آموزش داده شده است، یعنی تفسیر موفقیت آمیز داده ها.

برخی از روش های یادگیری ماشین

الگوریتم های یادگیری ماشین عمدتا در دو نوع نظارت شده و نظارت نشده دسته بندی می شوند.

  • الگوریتم یادگیری ماشین نظارت شده می تواند از آن چه که در گذشته آموخته اند و همچنین داده های جدید برچسب گذاری شده، برای پیشبینی آینده استفاده کند. این کار از آنالیز مجموعه داده های آموزشی شروع می شود، الگوریتم یادگیری یک عملکرد استنباطی تولید می کند تا پیش بینی های مربوط به مقادیر خروجی را انجام دهد. این نوع سیستم قادر است پس از آموزش های کافی برای هر داده جدیدی هدف مشخص کند. این الگوریتم یادگیری همچنین می تواند خروجی اش را با خروجی درست و از قبل تعیین شده مقایسه کند و خطاهای موجود را بیابد تا بر اساس آن مدل را اصلاح کند.
    • در مقابل، زمانی از الگوریتم های یادگیری ماشین بدون نظارت استفاده می شود که اطلاعات مورد نیاز برای آموزش نه طبقه بندی شده باشد و نه برچسب زده باشد. یادگیری بدون نظارت چگونگی اینکه سیستم می تواند توصیف ساختار پنهان از داده های بدون برچسب استنباط کنند، مطالعه می کند. این نوع سیستم خروجی مناسب را مشخص نمی کند و تنها می تواند داده ها را کاوش کند و از داده های برچسب زده نشده ساختارهای پنهان را استنتاج می کند.
    • الگوریتم یادگیری ماشین نیمه نظارت شده بین دو نوع قبلی قرار دارد. این سیستم از هر دو نوع داده برچسب زده شده و برچسب نزده شده برای آموزش استفاده می کند. سیستم هایی که از این روش استفاده می کنند، می توانند دقت یادگیری را تا میزان قابل توجهی بهبود ببخشند. معمولا زمانی این نوع یادگیری را انتخاب می کنیم که داده های برچسب زده شده بدست آمده  نیاز به منابع ماهر و مرتبط برای آموزش و یادگیری دارند. در غیر این صورت ، دستیابی به داده های دارای برچسب معمولاً نیازی به منابع اضافی ندارد.
    • الگوریتم های یادگیری ماشین تقویت کننده روشی هستند که به وسیله اقدامات با محیط خود در تعامل هستند و خطاها و پاداش ها را کشف می کنند. آزمایش، جست و جوی خطاها و  پاداش های تاخیری مهم ترین ویژگی های یادگیری تقویتی هستند. این نوع یادگیری به ماشین ها و عوامل نرم افزار اجازه می دهد تا به طور خودکار، برای به حداکثر رساندن عملکرد خود، رفتار ایده آل خود را مشخص کنند. این سیستم از بازخورد پاداش ساده استفاده می کند تا ببیند کدام عمل بهتر بهتر است و این امر به عنوان سیگنال تقویت شناخته شده است.

یادگیری ماشین آنالیز مقادیر انبوهی از داده ها را امکان پذیر می کند. این یادگیری در شناسایی فرصت های سودآور و یا خطرناک معمولا نتایج سریعتر و دقیق تری ارائه می کند اما برای آموزش آن ممکن است به زمان و منابع اضافی نیاز داشته باشیم.  تلفیقی از یادگیری ماشین و هوش مصنوعی و فناوری های شناختی می تواند در پردازش حجم زیادی از اطلاعات موثر باشد.

منبع: emerj.com

اگر این مطلب برای شما نیز مفید بود، آن را با دوستان خود به اشتراک بگذارید.

محمد بازدید : 27 سه شنبه 26 فروردین 1399 نظرات (0)
معرفی انواع هوش مصنوعی

عصر هوش مصنوعی پیش روی ما است و از بسیاری جهات ، ما را مجذوب خود کرده است. ما در اطلاعات ، مقالات و نظریه ها در مورد هوش مصنوعی غرق شده ایم. کارشناسان و غیر کارشناسان تلاش می کنند آینده ای را که ناشی از ظهور این فناوری است برای ما پیش بینی کنند. . به دلیل جریان مداوم اطلاعات در هوش مصنوعی ، تشخیص اینکه دقیقاً هوش مصنوعی چیست ، دشوارتر می شود. تعداد کمی از ما قادر به تعریف هوش مصنوعی هستیم. بسیاری از ما آن را با سایر کلید واژه ها مانند “روبات” اشتباه می گیریم و مترادف می دانیم.

به لطف کتابهای علمی تخیلی ، فیلم ها و گمانه زنی های مربوط به آینده ، بسیاری از ما تصوری از دنیایی را که توسط ربات ها اداره می شود را داریم. حالا که ظاهراً در دوره هوش مصنوعی قرار گرفته ایم ، ناگزیریم که بپرسیم و بیشتر بدانیم که هوش مصنوعی چیست؟ چقدر با آنچه در تصور ماست متفاوت است؟

حقیقت این است که ، با وجود اینکه در محاصره هوش مصنوعی و اطلاعات آن هستیم، کمتر کسی از اصطلاح “هوش مصنوعی” به درستی استفاده می کنند. سو استفاده و سو تفاهم از این اصطلاح می تواند باعث شود كه ما اظهارات و مفروضات غلطی را در مورد آنچه كه آینده در اختیار دارد ، قرار دهیم. همانطور که می دانیم ، جهان با یک سرعت رو به افزایش در حال تغییر است ، بنابراین اگر می خواهیم در آینده پیشرفت کنیم ، داشتن تفکر منطقی در مورد این تغییرات بسیار مهم است. برای انطباق در دنیایی با محوریت تغییر، درک پیامدهای هوش مصنوعی بر جامعه و روشن شدن جایگاهمان که باید امروز در کجا بایستیم ، ابتدا باید بین انواع مختلف هوش مصنوعی تمایز قایل شویم.

 هوش مصنوعی محدود (Artificial Narrow Intelligence)

تعریف “گسترده” از هوش مصنوعی مبهم است و می تواند باعث ایجاد درک نادرستی از نوع هوش مصنوعی شود که امروز با آن تعامل داریم.

هوش مصنوعی محدود (ANI) هوش مصنوعی ای است که امروزه در جهان ما وجود دارد. هوش مصنوعی محدود هوشی است که برای انجام یک کار واحد برنامه ریزی شده است – خواه برای بررسی آب و هوا ، بازی شطرنج ، یا تجزیه و تحلیل داده های خام برای نوشتن گزارش های روزنامه نگاری باشد.

سیستم های ANI می توانند در زمان واحد یک کار را انجام دهد و اطلاعات را از یک دیتا ست خاص جمع آوری می کند. در نتیجه ، این سیستم ها نمی توانند بیش از یک وظیفه ای که برای انجام آنها تعریف شده است کار دیگری انجام دهند.

برخلاف هوش مصنوعی عمومی، که در ادامه بیشتر در مورد آنها بحث خواهیم کرد ، هوش مصنوعی محدود، آگاهانه ، احساساتی و یا احساسی نیست و همانند انسان هدایت نمی شود. هوش مصنوعی محدود با داده های از پیش تعیین شده و از پیش تعریف شده عمل می کند ، حتی با اینکه به نظر می رسد بسیار پیچیده تر از آن باشد.

هر نوع هوش دستگاهی که امروز ما را احاطه کرده است ، هوش مصنوعی محدود است. دستیارGoogle ، Google Translate ، Siri و سایر ابزارهای پردازش زبان طبیعی نمونه هایی از Narrow AI هستند. برخی ممکن است تصور کنند که این ابزارها به دلیل توانایی تعامل با ما و پردازش زبان انسانی “محدود” نیستند ، اما دلیل اینکه ما آن را هوش مصنوعی “محدود” می نامیم این است که این دستگاه ها به هیچ وجه نزدیک به هوش انسان نیستند. آنها فاقد هوشیاری ، آگاهی و هوش واقعی برای مطابقت با هوش انسانی هستند. به عبارت دیگر ، آنها نمی توانند برای خودشان فکر کنند.

این دلیلی است که توضیح می دهد چرا وقتی سؤالات انتزاعی راجع به مواردی مانند معنای زندگی یا چگونگی حل یک مشکل شخصی به Siriیا دستیار Google ارائه می دهیم ، پاسخهای مبهمی می گیریم که غالباً منطقی نیستند ، یا به مقالات اینترنتی موجود ارجاع داده می شویم که به این سوالات می پردازند. از طرف دیگر ، وقتی از Siri سؤال می کنیم که هوای بیرون چطور است ، پاسخ دقیقی می گیریم. این به دلیل آن است که سوالی پرسیده ایم که در محدوده اطلاعاتی است که برای آن طراحی شده است.

ما به عنوان انسان ، توانایی ارزیابی محیط اطراف خود ، موجودات و واکنش های عاطفی به موقعیت ها را داریم. . هوش مصنوعی که وجود دارد ، انعطاف پذیری مغز ما را ندارد که مانند انسان فکر کند. حتی اتومبیل های پیشرفته خود ران نیز از چندین سیستم هوش مصنوعی محدود تشکیل شده اند و با همه پیچیدگی شان در این نوع دسته بندی می شوند.

هوش مصنوعی عمومی (Artificial General Intelligence)

هوش عمومی مصنوعی به ماشینهایی اطلاق می شود که دارای هوش انسانی هستند. . به عبارت دیگر ، AGI می تواند هر وظیفه فکری را که یک انسان می تواند انجام دهد را،  با موفقیت انجام دهد. این نوعی هوش مصنوعی است که ما در فیلم هایی مانند “او” یا سایر فیلم های علمی تخیلی می بینیم که در آن انسان ها با ماشین ها و سیستم عامل هایی که دارای آگاهی و احساسات هستند و تحت تأثیر احساسات و خودآگاهی قرار دارند ، در تعامل هستند.

how-to-develop-machine-learning-applications-for-business-featured

در حال حاضر ، ماشین آلات قادرند داده ها را سریعتر از حد ممکن پردازش کنند. اما به عنوان انسان ، ما این توانایی را داریم که تصمیم گیری آگاهانه انجام دهیم یا ایده های خلاقانه و تفکر انتزاعی و استراتژیک داشته باشیم و یا در افکار و خاطرات خود تعمق کنیم. این نوع هوش ما را برتر از ماشین ها می کند ، اما تعریف آن دشوار است زیرا در اصل ناشی از توانایی ما به عنوان یک  موجود احساسی است.

از AGI انتظار می رود که بتواند استدلال کند ، مشکلات را حل کند ، در زمان عدم قطعیت قضاوت کند ، برنامه ریزی کند ، یاد بگیرد ، دانش قبلی را در تصمیم گیری ادغام کند و مبتکر ، دارای قوه تخیل و خلاق باشد.

اما برای دستیابی ماشین  به هوشی شبیه به انسان ، نیاز است که قادر به تجربه و آگاهی باشند.

سوپر هوش مصنوعی (Artificial Super Intelligence)

نیک بوستروس ،استاد فیلسوف دانشگاه آکسفورد ، سوپر هوش مصنوعی را اینگونه تعریف می کند:

“هر هوشی که تقریباً بتواند از عملکرد شناختی انسان در همه حوزه های مورد نظر فراتر رود”

سوپر هوش مصنوعی (ASI) از هوش انسانی در همه ابعاد – از خلاقیت ، تا خرد عمومی ، تا حل مسئله- پیشی خواهد گرفت. ماشین ها قادر به نمایش اطلاعاتی خواهند بود که ما در فرهیخته ترین افراد انسانی ندیده ایم. این نوع هوش مصنوعی است که افراد زیادی نگران آن هستند و نوعی است که افرادی مانند ایلان ماسک فکر می کنند منجر به انقراض نسل بشر خواهد شد.

منبع: medium.com

برای مطالعه بیشتر راجع به هوش مصنوعی به بلاگ عامر اندیش مراجعه کنید.

محمد بازدید : 21 سه شنبه 19 فروردین 1399 نظرات (0)
معرفی یک اپلیکیشن گفتار به نوشتار فارسی اندروید

امروزه بخش بزرگی از زمان روزمره ما اختصاص به گوشی‌های هوشمندمان دارد. همه‌ی ما زمان‌های زیادی را از گوشی‌هایمان استفاده می‌کنیم. با پیشرفت موبایل‌ها و افزایش استفاده از پیام رسان‌ها، استفاده از اپلیکیشن‌هایی برای تبدیل گفتار به نوشتار فارسی اندروید اهمیت بیشتری پیدا کرده است. همه‌ی ما دوست داریم زمان‌هایی که به تایپ کردن متن اختصاص می دهیم را کوتاه‌تر کنیم و یا اینکه به گوشی هوشمندمان دیکته بگوییم تا دیگر نیازی نباشد که تایپ کنیم. امروز و در این مقاله قصد داریم تا یک اپلیکیشن رایگان برای تایپ صوتی فارسی معرفی کنیم. در ادامه با ما همراه باشید.

تبدیل گفتار به نوشتار یا همان تایپ صوتی چیست؟

تایپ صوتی در حقیقت یکی از کارکردهای فناوری تبدیل گفتار به نوشتار می‌باشد و قابلیتی است که باعث می‌شود بتوانیم به کامپیوتر و یا گوشی هوشمندمان دیکته بگوییم. یعنی گوشی هوشمند ما به کمک آن می‌تواند هر آنچه که می‌گوییم را تایپ کند.

تایپ صوتی در حقیقت به افراد کمک می‌کند تا بدون عمل تایپ کردن در کامپیوتر یا گوشی هوشمند بتوانند بنویسند. نرم افزارهایی که تایپ صوتی را انجام می‌دهند می‌توانند هر آنچه که به صورت صوت و یا گفت و گوی شفاهی می‌باشد را به متن قابل ویرایش تبدیل نمایند.

اپلیکیشن فارس آوا چیست؟

در سال‌های اخیر که هوش مصنوعی به زندگی روزمره افراد پا گذاشت و انسان‌ها روز به روز بیشتر از این فناوری به صورت پیدا و پنهان استفاده می‌کنند، متخصصان هوش مصنوعی و شرکت‌های داخلی هم به این حوزه ورود کردند تا از این قافله عقب نمانند. در این میان به دلیل نیاز به نرم افزاری تخصصی برای تبدیل هوشمند گفتار به نوشتار در زبان فارسی، به دلیل پیچیدگی‌ها و تفاوت زیاد بین گفتار و نوشتار در آن، به سراغ ساخت یک اپلیکیشن برای تایپ صوتی فارسی رفتند.

همان طور که اشاره شد در زبان فارسی تفاوت بین گفتار و نوشتار تا حدودی زیاد است. از طرفی دیگر برخی اصطلاحات و عباراتی در گفتار زبان فارسی وجود دارد که در نوشتار آن به کار نمی‌رود. از طرف دیگر این زبان با گستره‌ی عظیمی که دارد، گویش‌ها و لهجه‌های متفاوتی را شامل می‌شود که یک اپلیکیشن تایپ صوتی با کیفیت در زبان فارسی باید همه‌ی آن‌ها را متوجه شود.

تایپ صوتی فارسی چیست؟

فارس آوا یک اپلیکیشن محصول شرکت عامر اندیش است که همان طور که از نام آن پیداست عملیات تایپ صوتی فارسی و تبدیل گفتار به نوشتار را در زبان فارسی انجام می‌دهد. فارس آوا امکان ارتباط کلامی انسان با کامپیوتر و یا موبایل را فراهم می کند. این نرم افزار با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهره گیری از آخرین تکنولوژی‌های روز دنیا تولید شده است و به دلیل جمع آوری بزرگ ترین دیتاست موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهره مندی از تنوع گفتاری بسیار وسیع موفق شده است تا در رقابت با شرکت های بزرگی چون گوگل دارای ضریب دقت بالایی باشد.

اپلیکیشن فارس آوا چه قابلیت‌هایی دارد؟

اگر بخواهیم از ویژگی‌های اپلیکیشن فارس آوا صحبت کنیم، می‌توانیم به این موارد اشاره کنیم:

  • تبدیل گفتار به متن فارسی با دقت و سرعت بالا
  • بهره مندی از آخرین تکنولوژی‌های یادگیری عمیق
  • تبدیل گفتار به متن بصورت همزمان (Real-Time)
  • تشخیص گفتار و صوت در محیط های نویزی
  • پشتیبانی از انواع لهجه ها و گویش ها
  • قابلیت تبدیل گفتار محاوره ای به متن
  • پشتیبانی از انواع فرمتهای صوتی و ویدیویی
  • تبدیل گفتار انگلیسی به متن انگلیسی
  • غیر وابسته به گوینده و عدم نیاز به آموزش برای هر فرد
  • توسعه و تولید بصورت کاملاً بومی در داخل کشور
  • ارائه API و SDK تبدیل گفتار به متن در قالب وب سرویس
  • ارائه پنل تحت وب برای آپلود کردن فایلها جهت پردازش
  • قابل نصب روی سرور مشتری و عدم نیاز اتصال به اینترنت
  • بهره مندی از دایره واژگان (فرهنگ لغت) بسیار وسیع

همه‌ی این مواردی که گفته شد باعث می‌شود تا فارس آوا به یکی از اپلیکیشن‌های کاربردی با کیفیت در بازار ایران تبدیل شود. اپلیکیشن فارس آوا دارای رابط کاربری بسیار ساده‌ای است که هر کاربری با هر سطحی از دانش تکنولوژی می‌تواند از آن بهره ببرد و گفته‌هایش را تبدیل به متن کند. علاوه بر آن بومی بودن این نرم افزار باعث شده تا بتواند لهجه‌ها و گویش‌های مختلف فارسی را متوجه شود و آن‌ها را با کیفیت خوبی به متن تبدیل نماید.

استفاده از api محصول فارس آوا برای تبدیل گفتار به نوشتار

چرا از اپلیکیشن فارس آوا به جای تبدیل گفتار به نوشتار گوگل استفاده کنم؟

شاید برای شما هم سوال باشد که چرا با وجود سرویس تبدیل گفتار به نوشتار گوگل باید به سراغ اپلیکیشن فارس آوا برویم؟ این سوال بسیار درست و بجا می‌باشد. مسئله اصلی رقابت و جایگزینی فارس آوا به جای سرویس گوگل نیست، مسئله آن است که یکسری نیازهایی وجود دارد که دلیلش آن است که تبدیل گفتار به نوشتار گوگل بر مبنای گفتار عام فارسی آموزش دیده است. همین امر باعث می‌شود تا کاربر فارسی را در برخی موارد با محدودیت‌هایی رو به رو کند.

یکی از این مشکلات نیاز به اتصال دائمی به اینترنت است. کاربر برای آنکه بتواند از سرویس تبدیل گفتار به نوشتار گوگل استفاده کند باید در طول آن زمان آنلاین باشد. مسئله دیگر آن است که گوگل چون بر اساس گفتار عام فارسی آموزش دیده است در تشخیص لهجه‌ها و گویش‌های متفاوت فارسی دچار مشکل می‌شود. به همین دلایل کاربر فارسی زبان احتمالا به اپلیکیشن دیگری برای تبدیل گفتار به نوشتار فارسی اندروید نیاز دارند.

 

اگر این مطلب برای شما مفید بود آن را با دوستانتان به اشتراک بگذارید و برای خواندن مطالب بیشتر راجه به هوش مصنوعی به بلاگ عامر اندیش مراجعه کنید.

محمد بازدید : 31 سه شنبه 27 اسفند 1398 نظرات (0)
چرا گفتار به نوشتار گوگل؟ مقایسه تایپ صوتی گوگل و فارس آوا

در مقاله‌ی تایپ صوتی گوگل در مورد مزایا و معایب استفاده از تبدیل گفتار به نوشتار گوگل صحبت کرده‌ایم. در این مقاله قصد داریم تا مشخصه‌های تبدیل گفتار به نوشتار گوگل و محصول فارس آوا شرکت عامر اندیش را با یکدیگر مقایسه کنیم.

تبدیل گفتار به نوشتار فارسی گوگل

تبدیل گفتار به نوشتار گوگل همان تایپ صوتی گوگل است که به صورت رایگان در سرویس‌هایی همچون Google Docs، Google Slides و… در اختیار کاربران قرار دارد. بسیاری از نرم‌افزارهایی که برای تایپ از آن استفاده می‌شود نیز قابلیت برخورداری از سرویس تبدیل گفتار به متن گوگل را دارد. تایپ صوتی گوگل بر روی کیبورد اکثر گوشی‌های هوشمند در دسترس می‌باشد و همان نشانگر میکروفونی است که در کنار دکمه‌ی فاصله کیبرد قرار گرفته است. در رایانه‌های شخصی نیز به صورت رایگان می‌توان و از طریق سرویس Google Doc از گفتار به نوشتار گوگل کمک گرفت.

سرویس تبدیل گفتار به متن گوگل در نسخه جدید خود از 119 زبان زنده دنیا پشتیبانی می‌کند که زبان فارسی نیز یکی از آن‌ها می‌باشد. تبدیل گفتار به متن گوگل قادر است گفتار عام در زبان فارسی را تشخیص داده و آن را به متن تبدیل نماید. هم‌اکنون این سرویس به صورت رایگان بر روی پلتفرم‌هایی که در بالا به آن‌ها اشاره شد در دسترس کاربران فارسی زبان می‌باشد.

سرویس هایی که از تایپ صوتی گوگل برخوردارند

تبدیل گفتار به نوشتار فارس آوا محصول عامر اندیش

فارس آوا، نرم افزار تبدیل گفتار به متن در زبان فارسی است که امکان ارتباط کلامی انسان با کامپیوتر و یا موبایل را فراهم می کند. این نرم افزار با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهره گیری از آخرین تکنولوژی‌های روز دنیا تولید شده است و به دلیل جمع آوری بزرگ ترین دیتاست موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهره مندی از تنوع گفتاری بسیار وسیع موفق شده است تا در رقابت با شرکت های بزرگی چون گوگل دارای ضریب دقت بالایی باشد.

علاوه بر آن فارس آوا دارای دو محصول جانبی می‌باشد که تبدیل متن به گفتار یا Text to Speech و استخراج کلمات کلیدی یا Keyword Spotting را انجام می‌دهند. همان‌طور که در ابتدای مقاله گفتیم، قبلا در مورد معایب و مزایای تایپ صوتی گوگل صحبت کرده‌ایم. در این مقاله قصد داریم محصول فارس آوا شرکت عامر اندیش را با تایپ صوتی گوگل مقایسه کنیم و ببینیم در چه بخش‌هایی محصول فارس آوا می‌تواند از آن پیشی بگیرد.

مقایسه گفتار به نوشتار گوگل و فارس آوا در زبان فارسی

در بسیاری لحاظ محصول فارس آوا و تایپ صوتی گوگل دارای شباهت‌هایی می‌باشند. اما این دو محصول دارای یکسری تفاوت‌های قابل توجهی هستند. این تفاوت‌ها ناشی از متمرکز بودن محصول فارس آوا بر روی زبان فارسی است و اینکه تبدیل گفتار به متن گوگل بر روی گفتار عام زبان فارسی نمرکز دارد و نه لغات تخصصی و مخصوص به این زبان.

تشخیص لهجه و گویش

زبان فارسی پر است از گویش‌ها و لهجه‌های متفاوت. برای آنکه یک نرم‌افزار تبدیل گفتار به نوشتار بتواند به خوبی در زبان فارسی کار کند، باید بتواند تمام این گویش‌ها و لهجه‌ها را تشخیص دهد. متاسفانه سرویس تبدیل گفتار به نوشتار گوگل تنها می‌تواند گفتار عام در زبان فارسی را به خوبی متوجه شود و لهجه‌ها و گویش‌های مختلف زبان فارسی به آن آموزش داده نشده است. لذا برای کسانی که می‌خواهند یک سرویس داخلی با قالبلیت تبدیل گفتار به نوشتار فارسی ارائه نمایند، نمی‌توانند به طور کامل بر سرویس گوگل اتکا کننند.

از سوی دیگر، محصول فارس آوا قابلیت آن را دارد که گویش‌ و لهجه‌های مختلف را در زبان فارسی تشخیص دهد و آن‌ها را تبدیل به متن نماید. از آنجایی که این محصول بر روی زبان فارسی متمرکز شده است تمام این لهجه‌ها به آن آموزش داده شده است و کسانی که می‌خواهند از این محصول استفاده کنند دیگر لازم نیست نگران تشخیص گفتار در گویش و لهجه‌های متفاوت باشند.

تشخیص گفتار رسمی و محاوره‌ای

همانند تشخیص لهجه و گویش‌های مختلف در زبان فارسی، محصول فارس‌آوا می‌تواند گفتار رسمی در زبان فارسی را از گفتار محاوره‌ای تشخیص دهد. همه می‌دانیم که در زبان فارسی تفاوت بین گفتار محاوره و گفتار رسمی بسیار زیاد است و سرویس تبدیل گفتار به متن کاربردی باید بتواند این دو را از یکدیگر تمیز دهد. متاسفانه سرویس گوگل دارای چنین قابلیتی نمی‌باشد.

دسترسی API

درست است که سرویس گوگل بر روی پلتفرم‌هایی که از آن یاد شد به صورت رایگان در دسترس عموم می‌باشد، اما کسب‌وکارهای پلتفرمی که برای مجهز کردن خود به سرویس تبدیل گفتار به نوشتار می‌خواهند از گوگل API دریافت کنند باید ماهیانه مبلغی را به دلار بپردازند. پر واضح است که پرداخت مبلغ به دلار برای کسب‌وکارهای ایرانی هزینه‌ی گزافی به همراه دارد. در مقابل این کسب‌وکارها می‌توانند از محصول فارس‌آوا استفاده کنند.

تبدیل گفتار به نوشتار فارس آوا

سفارشی سازی تبدیل گفتار به نوشتار

یکی دیگر از نکات مهمی که در تبدیل گفتار به متن گوگل وجود ندارد و قابلیت سفارشی سازی برای کسب‌وکارهای مختلف است. برخی از کسب‌وکارها همانند وکالت دارای اصطلاحات تخصصی در زبان فارسی هستند که این کلمات تخصصی به سرویس تایپ صوتی گوگل آموزش داده نشده است. در مقابل محصول فارس‌آوا دارای چنین قابلیتی می‌باشد و می‌تواند برای کسب‌وکارهای مختلف سفارشی سازی شود.

قابلیت پردازش فایل‌های صوتی از پیش ضبط شده

یکی از قابلیت‌های خوب محصول فارس‌آوا که سرویس تبدیل گفتار به متن گوگل از آن محروم است، قابلیت پردازش فایل‌های صوتی از پیش ضبط شده می‌باشد. شما می‌توانید فایل‌های صوتی با فرمت‌های مختلف را به محصول فارس‌آوا بدهید و در مقابل متن این فایل‌ها را دریافت نمایید.

قابلیت تبدیل گفتار به نوشتار به صورت آفلاین

محصول فارس‌آوا دارای اپلیکیشن اندرویدی و نسخه دسکتاپ نیز می‌باشد که کاربران مختلف می‌توانند بدون نیاز به اتصال به اینترنت و به صورت آفلاین گفتار خود را به نوشتار تبدیل کنند. نسخه دسکتاپ و اپلیکیشن محصول فارس‌آوا بصورت رایگان در دسترس عموم می‌باشد و کاربران می‌توانند از آن استفاده نمایند. در مقابل سرویس گوگل دارای چنین قابلیتی نمی‌باشد و برای استفاده از آن شما باید در تمام مدت به اینترنت متصل باشید.

اگر درخواست دموی محصول فارس آوا را دارید می‌توانید به صفحه تماس با ما مراجعه کرده و برای ما فرم پر کنید.

محمد بازدید : 35 سه شنبه 20 اسفند 1398 نظرات (0)
تایپ صوتی در گوگل ، مزایا و معایب

در این مقاله قصد داریم تا یکی از پرکاربرد ترین قابلیت‌های گوگل را بررسی کنیم و ببینیم که چه مزایا و معایبی دارد. قابلیت مورد نظر ما تایپ صوتی در گوگل است که به کاربران این اجازه را می‌دهد تا بدون نیاز به تایپ کردن تنها با گفتن چیزی متن آن را داشته باشند. در ادامه با ما همراه باشید.

تایپ صوتی گوگل چیست؟

اگر بخواهیم تعریف دقیقی از این فناوری داشته باشیم، می‌توانیم بگوییم که تایپ صوتی در گوگل یک ابزار رایگان برای دیکته گفتن در سرویس‌هایی همانند Google Docs، Google Slides و پردازنده کلمات آنلاین گوگل و ابزارهای پرزنت و ارائه آن می‌باشد. از آنجایی که بیشتر نرم افزارهایی که برای تایپ کردن از آن‌ها استفاده می‌شود، قابلیت برخورداری از این سرویس گوگل را دارند، به طور کلی می‌توان گفت که تایپ صوتی گوگل قابلیت استفاده برای همه را دارد.

تایپ صوتی گوگل در روی کیبرد اکثر گوشی‌های هوشمند وجود دارد و در حقیقت همان نشانه‌ی میکروفونی است که در پایین کیبرد و در سمت چپ دکمه فاصله قرار گرفته است. در رایانه‌های شخصی هم با استفاده از مرورگر کروم می‌توانید از سرویس Google Doc کمک گرفته و از این فناوری استفاده نمایید.

سرویس هایی که از تایپ صوتی گوگل برخوردارند

در بروزترین نسخه این سرویس قادر است از 119 زبان زنده دنیا پشتیبانی کند و محتوای موجود در صوت‌های این زبان‌ها را به متن تبدیل کند. سرویس رایگان تایپ صوتی گوگل نیز برای کاربران فارسی زبان و بر روی زبان فارسی نیز در دسترس عموم می‌باشد.

چگونه از تایپ صوتی گوگل استفاده کنیم؟

کاربرانی که از گوشی‌های هوشمند استفاده می‌کنند با زدن دکمه‌ی میکروفون بر روی کیبرد گوشی خود می‌توانند از تایپ صوتی گوگل بهره‌مند شوند. در تصویر زید می‌توانید محل این دکمه را مشاهده نمایید.

دکمه کیبرد برای استفاده از تایپ صوتی

اگر از Google Docs استفاده می‌کنید با مراجعه به منو، قسمت Tools را باز کرده و گزینه Voice typing را فعال نمایید.

تایپ صوتی در گوگل داک

لازم به ذکر است که قابلیت تبدیل صوت به متن گوگل برای سازندگان اپلیکیشنی که می‌خواهند از قابلیت تایپ صوتی بر روی اپ خود استفاده کنند در دسترس می‌باشد و با پرداخت هزینه می‌توانند api تایپ صوتی گوگل را دریافت نمایند.

آیا قابلیت تایپ صوتی گوگل بر روی زبان فارسی در ایران هم کاربرد دارد؟

بله، قابلیت تایپ صوتی گوگل بر روی زبان فارسی هم در دسترس کاربران فارسی زبان می‌باشد. با استفاده از راه‌هایی که گفته شد کاربران می‌توانند از مزایای سرویس تبدیل گفتار به نوشتار گوگل در زبان فارسی بصورت رایگان بهره‌مند شوند. پس از فعال کردن قابلیت تبدیل گفتار به نوشتار می‌توانید به آیکون زبان مراجعه کرده و پیش فرض زبان را تغییر داده و زبان فارسی را انتخاب نمایید. پس از اطمینان از صحت عملکرد و کیفیت میکروفونی که دارید می‌توانید از تایپ صوتی بهره‌مند شوید.

مزایای تایپ صوتی در گوگل چیست؟

گوگل در چند سال اخیر سرمایه‌گذاری سرسام آوری را بر روی فناوری زبان بر روی زبان‌های مختلف در دنیا انجام داده است. نتیجه‌ی این سرمایه‌گذاری فوق‌العاده فناوری شده که در بسیاری از زبان‌ها با کیفیت خوب گفتار را درک کرده و آن را به نوشتار تبدیل می‌نماید. از مزایای تایپ صوتی فوق‌العاده گوگل می‌توان به موارد زیر اشاره نمود:

سرعت فوق‌العاده

قدرت تایپ کلمات یک فرد عادی بین 38 تا 40 کلمه در دقیقه می‌باشد که این تعداد برابر است با به طور میانگین 2400 کلمه در ساعت. اگر به جای روش‌های تایپ قدیمی از تایپ صوتی گوگل استفاده شود این سرعت را می‌توان تا چیزی حدود 4 برابر افزایش داد. یعنی در هر دقیقه به صورت میانگین 150 کلمه.

دسترسی بالا

از آنجایی که تایپ صوتی گوگل بر روی پلتفرم‌های متفاوتی در دسترس است و در گوشی‌های هوشمند نیز می‌توان در هر کجا از آن استفاده کرد، می‌توان در هر کجا از آن استفاده نمود. دیگر لازم نیست همانند روش‌های قدیمی یک جا نشسته و ساعت‌ها به تایپ کردن مشغول شوید.

دقت بالا

یک تایپیست معمولی به صورت میانگین از هر 100 کلمه 8 کلمه را اشکال دارد. در صورتی که با استفاده از تبدیل گفتار به نوشتار گوگل میزان خطا تا حد زیادی کاهش میابد. زیرا به جای نوشتن کلمات با استفاده از کیبرد، کلمات مستقیما به هوش مصنوعی گوگل گفته شده و او نیز آن‌ها را به نوشته تبدیل کرده است.

توانایی تبدیل صوت به متن در هر پلتفرمی

به کمک سرویس تبدیل گفتار به نوشتار گوگل می‌توانید فایل‌ها را به هر فرمتی که می‌خواهید ذخیره کنید. زیرا بسیاری از نرم افزارهایی که از آن‌ها استفاده می‌شوند قابلیت وصل شدن به سرویس تایپ صوتی را دارند. در غیر این صورت نیز می‌توانید از پلتفرم‌های گوگل برای تبدیل گفتار به نوشتار استفاده نموده و پس از ویرایش فایل نهایی آن را در پلتفرم مورد نظر کپی کرده و با فرمت دلخواه ذخیره نمایید.

پر واضح است اگر بخواهیم مزایای تایپ صوتی گوگل را بنویسیم، می‌توانیم یک مقاله را به آن اختصاص دهیم. اما قصد ما در این مقاله بررسی کلی این قابلیت است و می‌خواهیم از تمام جوانب به آن نگاهی بندازیم.

معایب تایپ صوتی در گوگل چیست؟

شاید عنوان این بخش برای شما سوال بر انگیز باشد و بگویید مگر ممکن است که سرویسی که گوگل با آن همه عظمت ارائه می‌دهد عیب و یا مشکلی داشته باشد؟ باید بگوییم که برای کاربرانی که کارهای کوچکی با تایپ صوتی دارند و نمی‌خواهند به طور پیشرفته از آن استفاده کنند، این سرویس همانگونه که هست بسیار عالی خواهد بود و نقدی بر آن نیست. مشکل از جایی شروع می‌شود که بخواهیم از تایپ صوتی برای مقاصد پیشرفته‌تر استفاده نماییم. در این بخش ممکن است با مشکلات زیر مواجه شویم:

نیاز به اتصال دائمی اینترنت

شاید بتوان گفت یکی از معایب این تایپ صوتی گوگل بخصوص در زبان فارسی آن است که در زمان استفاده از آن حتما باید به اینترنت دسترسی دائم داشته باشید. این مسئله شاید در استفاده‌های محدود و کم به چشم نیاید اما زمانی که نیاز دارید تا گفتارهای طولانی را به متن تبدیل کنید و یا در مکان‌هایی قرار دارید که دسترسی مناسبی به اینترنت ندارید، بسیار مشکل آفرین می‌شود.

سرور خارج از ایران

یکی از مشکلاتی که سازمان‌های داخلی با آن روبه‌رو هستند، آن است که طبیعتا چون گوگل یک شرکت‌های خارجی است، سرورهای آن نیز در خارج از کشور قرار دارد و سازمان‌ها و شرکت‌هایی که دارای داده‌هایی هستند که نمی‌خواهند به خارج از سازمان برود، عملا نمی‌توانند از تایپ صوتی گوگل استفاده کنند. زیرا آن‌ها به سرویس‌هایی نیاز دارند که به صورت لوکال بر روی سرورهای خودشان نصب شود و هیچ اطلاعاتی را به بیرون از سازمان نفرستند.

عام بودن گفتار به نوشتار

یکی از مشکلاتی که کاربران فارسی زبان در استفاده از تایپ صوتی گوگل با آن مواجهه هستند، آن است که این سرویس تنها قادر است گفتار عام در زبان فارسی را متوجه شود و کلمات تخصصی در زبان فارسی که برخی کسب‌وکارها، همانند وکلا و حقوقدانان و…، از آن‌ها به کرات استفاده می‌کنند را به درستی متوجه نمی‌شود. به همین خاطر کسب‌وکارهای این چنینی برای تبدیل گفتار به نوشتار و تایپ صوتی نمی‌توانند بر کمک گوگل اتکا کنند.

نفهمیدن لهجه‌های مختلف زبان فارسی

زبان فارسی پر است از لهجه‌ها و گویش‌های مختلف. اگر نرم افزاری بخواهد در زبان فارسی به خوبی کار کند نیاز دارد که تمام این لهجه‌ها را متوجه شود. متاسفانه همانطور که در مورد قبل به آن اشاره شد تایپ صوتی گوگل گفتار عام زبان فارسی را متوجه می‌شود و باز هم کاربران فارسی زبان با مشکلات بسیاری در این زمینه روبه‌رو هستند.

پولی بودن api سرویس تایپ صوتی گوگل

بسیاری از توسعه دهندگان اپلیکیشن که می‌خواهند از قابلیت تایپ صوتی در اپلیکیشن خود استفاده نمایند، اول از همه به سراغ سرویس گوگل می‌روند. برعکس اینکه تایپ صوتی گوگل بر روی سرویس‌هایی که خود ارائه می‌دهد رایگان می‌باشد، برای دریافت api آن به صورت دقیقه‌ای باید هزینه پرداخت نمود. چون این هزینه به دلار محاسبه می‌شود برای کاربران داخلی استفاده از آن به صرفه نمی‌باشد و عملا نمی‌توانند از تایپ صوتی گوگل استفاده نمایند.

زمانی که تایپ صوتی گوگل در زبان فارسی مشکل آفرین می‌شود چه کنیم؟

اگر شما هم در استفاده از تایپ صوتی در گوگل به معایبی که گفته شد و یا مشکلات دیگری برخوردید، تنها راه شما روی آوردن به سرویس‌های تایپ صوتی دیگر است. سرویس‌هایی که بتواند همان کیفیت را با استانداردهای مورد نیاز شما در اختیارتان قرار دهد. اگر به دنبال چنین سرویسی هستید، ما فارس آوا را به شما معرفی می‌کنیم. سرویس فارس آوا یکی از بهترین موتورهای تبدیل گفتار به نوشتار در زبان فارسی می باشد.

تایپ صوتی فارسی چیست؟

محصول فارس آوا تبدیل گفتار به نوشتار را به صورت تخصصی برای زبان فارسی انجام می دهد و قادر است ارتباط کلامی بین شما و کامپیوتر یا موبایلتان را فراهم کند. محصول فارس آوا با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهره گیری از آخرین تکنولوژی های روز دنیا تولید شده است و به دلیل جمع آوری بزرگ ترین دیتاسِت موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهره مندی از تنوع گفتاری بسیار وسیع موفق شده است تا در رقابت با شرکت های بزرگی چون گوگل (بر روی زبان فارسی) دارای ضریب دقت بالایی باشد.

محصول فارس آوا دارای قابلیت های زیر می باشد:

  • تبدیل گفتار به متن فارسی با دقت و سرعت بالا
  • بهره مندی از آخرین تکنولوژیهای یادگیری عمیق
  • تبدیل گفتار به متن بصورت همزمان (Real-Time)
  • تشخیص گفتار و صوت در محیط های نویزی
  • پشتیبانی از انواع لهجه ها و گویش ها
  • قابلیت تبدیل گفتار محاوره ای به متن
  • پشتیبانی از انواع فرمتهای صوتی و ویدیویی
  • تبدیل گفتار انگلیسی به متن انگلیسی
  • غیر وابسته به گوینده و عدم نیاز به آموزش برای هر فرد
  • ارائه API محصول فارس آوا و SDK تبدیل گفتار به متن در قالب وب سرویس
  • ارائه پنل تحت وب برای آپلود کردن فایلها جهت پردازش
  • قابل نصب روی سرور مشتری و عدم نیاز اتصال به اینترنت
  • بهره مندی از دایره واژگان (فرهنگ لغت) بسیار وسیع
  • تبدیل گفتار به نوشتار به کمک هوش مصنوعی

با توجه به قابلیت های ذکر شده، محصول فارس آوا می تواند چنین کاربرد هایی داشته باشد:

  • امکان استفاده در تمامی سیستم های عامل (Android, IOS, Mac, Windows, Linux)
  • امکان استفاده برای تمامی برنامه های تحت موبایل (تمامی پلتفرمها)
  • امکان استفاده در برنامه هایی از قبیل دستیارهای شخصی هوشمند در موبایل
  • امکان استفاده های عمومی از قبیل : تایپ گفتاری و اجرای دستورات صوتی
  • امکان سفارشی سازی برای تشخیص دستورات خاص صوتی
  • امکان سفارشی سازی برای کاربردهای خاص و افزایش دقت
  • پردازش داده های حجیم گفتاری

علاوه بر آن فارس آوا دارای دو محصول جانبی می‌باشد که می‌تواند عملیات تبدیل متن به گفتار (TTS) و استخراج کلمات کلیدی (KWS) را انجام دهد. چنانچه قصد دارید با محصول فارس آوا بیشتر آشنا شوید به صفحه محصول فارس آوا مراجعه کنید و اگر درخواست دمو دارید به صفحه تماس با ما مراجعه نمایید.

محمد بازدید : 137 چهارشنبه 14 اسفند 1398 نظرات (0)
معرفی یک نرم افزار با کیفیت ایرانی برای تبدیل گفتار به نوشتار فارسی

امروز استفاده از نرم افزارهای تبدیل گفتار به نوشتار در بین کاربران بسیار محبوب شده است. زیرا که به کمک این فناوری افراد می‌توانند بدون نیاز به ساعت‌ها پشت کامپیوتر نشستن و تایپ کردن، تنها با گفتن کلمات کامپیوتر آن‌ها را تایپ نماید. استفاده از نرم افزار تبدیل گفتار به نوشتار فارسی که مناسب نیازهای کاربران فارسی زبان باشد بسیار اهمیت دارد. سرویس‌های خارجی که کار تبدیل گفتار به نوشتار را انجام می‌دهند، بر روی زبان فارسی بسیار عام عمل کرده و در فهم کلمات بخصوصی که در گفتار فارسی وجود دارند، با مشکل مواجه هستند.

در چند سال اخیر شرکت‌های داخلی متعددی به سراغ ساخت نرم افزار تبدیل گفتار به نوشتار در زبان فارسی رفته‌اند و ساخت سرویس‌های تبدیل گفتار به متن مختلف باعث شده که کاربر در تشخیص سرویس خوب و با کیفیت دچار مشکل شود. به همین دلیل در این مقاله قصد داریم که یک نرم افزار با کیفیت تبدیل گفتار به نوشتار در زبان فارسی را به شما معرفی نماییم.

تبدیل گفتار به نوشتار چیست؟

تبدیل گفتار به نوشتار یکی از کاربردهای فناوری شناخت گفتار یا speech recognition است که مبتنی بر هوش مصنوعی می‌باشد. به کمک این فناوری کاربر می‌تواند محتوای یک گفت‌و‌گوی شفاهی را به صورت اتوماتیک به متن قابل ویرایش تبدیل کند. علاوه بر آن این فناوری قادر است هر نوع فایل صوتی را دریافت نماید و محتوای آن را به صورت فایل متنی قابل ویرایش به کاربر بدهد. به طور کلی فناوری تبدیل گفتار به نوشتار به نوعی بین رشته‌های زبان‌شناسی و رایانه می‌باشد و از علوم کامپیوتر، زبان شناسی و الکترونیک برای درک گفتار و تبدیل آن به متن استفاده می‌کند.

تبدیل گفتار به نوشتار فارس آوا

نرم افزارهای تبدیل گفتار به نوشتار به این شکل عمل می‌کنند که پس از گرفتن صوت ابتدا ویژگی‌های مشخصی را از گفتار استخراج می‌کنند و سپس به کمک مدل‌های آموزش داده شده ویژگی‌های استخراج شده را به دنباله‌ای از واج‌های احتمالی تبدیل کرده و به کمک مدل زبانی این واج‌ها را به رشته‌ای متنی تبدیل می‌کند.

فناوری تبدیل گفتار به نوشتار چه کاربردهایی دارد؟

chatbots-in-business

به طور کلی همان‌طور که از نام آن پیداست فناوری تبدیل گفتار به نوشتار از در تمام حوزه‌هایی که نیاز به تبدیل گفتار به نوشتار دارد استفاده می‌شود. از نرم افزارهای تبدیل گفتار به نوشتار می‌توان برای تبدیل محتوای فایل‌های صوتی به فایل‌های متنی، تایپ صوتی و دیکته به کامپیوتر و در نهایت ارتباط با کامپیوتر یا گوشی هوشمند استفاده نمود. به تفصیل کاربردهای این فناوری را می‌توان به صورت زیر شرح داد:

دارندگان آرشیوهای صوتی

این فناوری می‌تواند به سازمان‌ها، کسب‌وکارها یا افرادی که دارای آرشیو‌های صوتی با حجم زیاد هستند کمک کند تا محتوای آن‌ها را به فایل متنی تبدیل کرده و از آن‌ها مستند تهیه کنند.

مراکز تماس کسب‌وکارها

فناوری تبدیل گفتار به نوشتار می‌تواند به مراکز تماس کسب‌وکارها کمک کند تا تمامی گفت‌وگوهای انجام شده در تماس‌های مرکز و یا اطلاعات نیروهای انسانی را مکتوب نمایند.

اپلیکیشن‌ها

کسب‌وکارهایی که دارای اپلیکیشن هستند می‌توانند از فناوری تبدیل گفتار به نوشتار به عنوان یک رابط کاربری صوتی در اپلیکیشن‌شان استفاده نمایند.

علاوه بر موردهای دیگری که گفته شد، تمام کسانی که به نوعی به تایپ صوتی نیاز دارند اعم از نویسندگان، کارمندان، منشی ها و… می‌توانند از فناوری تبدیل گفتار به نوشتار استفاده کنند.

چرا بهتر است از نرم افزار تبدیل گفتار به نوشتار فارسی استفاده کنیم؟

شاید برای شما هم سوال باشد که چرا با وجود سرویس‌هایی همانند گوگل که تبدیل گفتار به متن را به صورت رایگان انجام می‌دهند، چرا از نرم افزارهای تبدیل گفتار به نوشتار فارسی استفاده کنیم. مسئله‌ای که در زبان فارسی، نسبت به سایر زبان‌ها بیشتر به چشم می‌خورد، آن است که تنوع گویش و لهجه بسیاری دارد. به همین دلیل برای تبدیل گفتار به نوشتار به نرم افزاری نیاز داریم که هم شناخت درستی از زبان فارسی داشته باشد و هم به صورت مداوم لهجه‌های مختلف موجود در زبان فارسی را فرا بگیرد.

علاوه بر آن در کسب‌وکارهای مختلف کلمات به خصوصی وجود دارند که سرویس‌هایی همانند گوگل، که دارای سیستم عام تشخیص گفتار می باشد، در یافتن آن‌ها دچار مشکل می‌شود. محصول گوگل صرفا می‌تواند گفتار عام فارسی را تشخیص دهد و آن را به نوشتار تبدیل نماید. مسئله‌ی دیگری که وجود دارد آن است که به دلیل وجود موضوعاتی مانند تحریم و… سرویس‌های خارجی دارای محدودیت‌هایی برای ایران هستند که این مسئله استفاده از آن‌ها را تا حدودی با مشکل مواجه نموده است.

با توجه به آنچه که گفته شد، اگر کسب‌وکاری قصد استفاده از فناوری تبدیل گفتار به نوشتار را دارد، باید از سرویس‌هایی استفاده کند که بتواند به آن، چه از لحاظ فنی چه از لحاظ دسترسی دائم و… اتکا نماید. اینجاست که استفاده از نرم افزارهای داخلی که تخصصی بر روی زبان فارسی متمرکز هستند اهمیت میابد.

فارس آوا یک نرم افزار داخلی با کیفیت برای تبدیل گفتار به نوشتار در زبان فارسی

اگر به دنبال نرم افزاری با کیفیت برای تبدیل گفتار به نوشتار فارسی هستید، ما فارس آوا را به شما معرفی می‌کنیم. محصول فارس آوا تبدیل گفتار به نوشتار را به صورت تخصصی برای زبان فارسی انجام می دهد و قادر است ارتباط کلامی بین شما و کامپیوتر یا موبایلتان را فراهم کند. محصول فارس آوا با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهره گیری از آخرین تکنولوژی های روز دنیا تولید شده است و به دلیل جمع آوری بزرگ ترین دیتاسِت موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهره مندی از تنوع گفتاری بسیار وسیع موفق شده است تا در رقابت با شرکت های بزرگی چون گوگل (بر روی زبان فارسی) دارای ضریب دقت بالایی باشد.

محصول فارس آوا دارای قابلیت های زیر می باشد:

  • تبدیل گفتار به متن فارسی با دقت و سرعت بالا
  • بهره مندی از آخرین تکنولوژیهای یادگیری عمیق
  • تبدیل گفتار به متن بصورت همزمان (Real-Time)
  • تشخیص گفتار و صوت در محیط های نویزی
  • پشتیبانی از انواع لهجه ها و گویش ها
  • قابلیت تبدیل گفتار محاوره ای به متن
  • پشتیبانی از انواع فرمتهای صوتی و ویدیویی
  • تبدیل گفتار انگلیسی به متن انگلیسی
  • غیر وابسته به گوینده و عدم نیاز به آموزش برای هر فرد
  • ارائه API محصول فارس آوا و SDK تبدیل گفتار به متن در قالب وب سرویس
  • ارائه پنل تحت وب برای آپلود کردن فایلها جهت پردازش
  • قابل نصب روی سرور مشتری و عدم نیاز اتصال به اینترنت
  • بهره مندی از دایره واژگان (فرهنگ لغت) بسیار وسیع

تبدیل گفتار به نوشتار به کمک هوش مصنوعی

با توجه به قابلیت های ذکر شده، محصول فارس آوا می تواند چنین کاربرد هایی داشته باشد:

  • امکان استفاده در تمامی سیستم های عامل (Android, IOS, Mac, Windows, Linux)
  • امکان استفاده برای تمامی برنامه های تحت موبایل (تمامی پلتفرمها)
  • امکان استفاده در برنامه هایی از قبیل دستیارهای شخصی هوشمند در موبایل
  • امکان استفاده های عمومی از قبیل : تایپ گفتاری و اجرای دستورات صوتی
  • امکان سفارشی سازی برای تشخیص دستورات خاص صوتی
  • امکان سفارشی سازی برای کاربردهای خاص و افزایش دقت
  • پردازش داده های حجیم گفتاری

علاوه بر آن فارس آوا دارای دو محصول جانبی می‌باشد که می‌تواند عملیات تبدیل متن به گفتار (TTS) و استخراج کلمات کلیدی (KWS) را انجام دهد. چنانچه قصد دارید با محصول فارس آوا بیشتر آشنا شوید به اینجا مراجعه کنید و اگر درخواست دمو دارید به اینجا مراجعه نمایید.

محمد بازدید : 135 سه شنبه 06 اسفند 1398 نظرات (0)
معرفی نرم افزار فارس آوا با قابلیت تایپ صوتی فارسی
۱۳۹۸-۱۱-۰۶0

امروز قصد داریم تا در این مقاله یکی از نرم افزارهای تایپ صوتی فارسی با کیفیت که در داخل کشور تولید شده است را معرفی کنیم. اگر شما هم جزء کسانی هستید که به هر دلیلی به دنبال یک نرم افزار تایپ صوتی برای تبدیل گفتار به نوشتار در زبان فارسی هستید، از محصول فارس آوا شرکت عامر اندیش هوشمند غافل نشوید. در ادامه برای معرفی این محصول با ما همراه باشید.

تایپ صوتی چیست؟

تا به حال در مورد فناوری تبدیل گفتار به نوشتار و چرایی استفاده از تایپ صوتی در اپلیکیشن کسب و کارها صحبت کرده‌ایم. تایپ صوتی نیز در حقیقت یکی از کارکردهای فناوری تبدیل گفتار به نوشتار می‌باشد. تایپ صوتی در حقیقت قابلیتی است که باعث می‌شود بتوانیم به کامپیوتر و یا گوشی هوشمندمان دیکته بگوییم. یعنی کامپیوتر به کمک این قابلیت هر آنچه که می‌گوییم را تایپ کند.

تایپ صوتی در حقیقت به افراد کمک می‌کند تا بدون عمل تایپ کردن در کامپیوتر یا گوشی هوشمند بتوانند بنویسند. نرم افزارهایی که تایپ صوتی را انجام می‌دهند می‌توانند هر آنچه که به صورت صوت و یا گفت و گوی شفاهی می‌باشد را به متن قابل ویرایش تبدیل نمایند.

تایپ صوتی فارسی چیست؟

نرم افزار فارس آوا چیست؟

در سال‌های اخیر که هوش مصنوعی به زندگی روزمره افراد پا گذاشت و انسان‌ها روز به روز بیشتر از این فناوری به صورت پیدا و پنهان استفاده می‌کنند، متخصصان هوش مصنوعی و شرکت‌های داخلی هم به این حوزه ورود کردند تا از این قافله عقب نمانند. در این میان به دلیل نیاز به نرم افزاری تخصصی برای تبدیل هوشمند گفتار به نوشتار در زبان فارسی، به دلیل پیچیدگی‌ها و تفاوت زیاد بین گفتار و نوشتار در آن، به سراغ ساخت نرم افزار تایپ صوتی فارسی رفتند.

همان طور که اشاره شد در زبان فارسی تفاوت بین گفتار و نوشتار تا حدودی زیاد است. از طرفی دیگر برخی اصطلاحات و عباراتی در گفتار زبان فارسی وجود دارد که در نوشتار آن به کار نمی‌رود. از طرف دیگر این زبان با گستره‌ی عظیمی که دارد، گویش‌ها و لهجه‌های متفاوتی را شامل می‌شود که یک نرم افزار تایپ صوتی با کیفیت در زبان فارسی باید همه‌ی آن‌ها را متوجه شود.

نرم افزار فارس آوا محصول شرکت عامر اندیش است که همان طور که از نام آن پیداست عملیات تایپ صوتی فارسی و تبدیل گفتار به نوشتار را در زبان فارسی انجام می‌دهد. فارس آوا امکان ارتباط کلامی انسان با کامپیوتر و یا موبایل را فراهم می کند. این نرم افزار با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهره گیری از آخرین تکنولوژی‌های روز دنیا تولید شده است و به دلیل جمع آوری بزرگ ترین دیتاست موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهره مندی از تنوع گفتاری بسیار وسیع موفق شده است تا در رقابت با شرکت های بزرگی چون گوگل دارای ضریب دقت بالایی باشد.

کاربرد‌های فارس آوا چیست؟

کاربردهای پرمزیت نرم افزار فارس آوا به شرح زیر می‌باشد:

  • امکان استفاده در تمامی سیستم های عامل (Android, IOS, Mac, Windows, Linux)
  • امکان استفاده برای تمامی برنامه های تحت موبایل (تمامی پلتفرم‌ها)
  • امکان استفاده در برنامه هایی از قبیل دستیارهای شخصی هوشمند در موبایل
  • امکان استفاده های عمومی از قبیل : تایپ گفتاری و اجرای دستورات صوتی
  • امکان سفارشی سازی برای تشخیص دستورات خاص صوتی
  • امکان سفارشی سازی برای کاربردهای خاص و افزایش دقت
  • پردازش داده های حجیم گفتاری

قابلیت‌های نرم افزار فارس آوا چیست؟

نرم افزار فارس آوا دارای چنین قابلیت‌هایی می‌باشد:

  • تبدیل گفتار به متن فارسی با دقت و سرعت بالا
  • بهره مندی از آخرین تکنولوژی‌های یادگیری عمیق
  • تبدیل گفتار به متن بصورت همزمان (Real-Time)
  • تشخیص گفتار و صوت در محیط های نویزی
  • پشتیبانی از انواع لهجه ها و گویش ها
  • قابلیت تبدیل گفتار محاوره ای به متن
  • پشتیبانی از انواع فرمتهای صوتی و ویدیویی
  • تبدیل گفتار انگلیسی به متن انگلیسی
  • غیر وابسته به گوینده و عدم نیاز به آموزش برای هر فرد
  • توسعه و تولید بصورت کاملاً بومی در داخل کشور
  • ارائه API و SDK تبدیل گفتار به متن در قالب وب سرویس
  • ارائه پنل تحت وب برای آپلود کردن فایلها جهت پردازش
  • قابل نصب روی سرور مشتری و عدم نیاز اتصال به اینترنت
  • بهره مندی از دایره واژگان (فرهنگ لغت) بسیار وسیع

تایپ صوتی فارس آوا

چرا از تایپ صوتی فارسی نرم افزار فارس آوا استفاده کنیم؟

با توجه به آنچه که گفته شد، نرم افزار فارس آوا یک نرم افزار با کیفیت برای تایپ صوتی در زبان فارسی است. نرم افزار فارس آوا کاملا بومی است بر دانش متخصصان هوش مصنوعی کشور تکیه دارد و دارای دیتابیس وسیع 10 هزار ساعته می‌باشد. این نرم افزار بر روی دسکتاپ و گوشی هوشمند در دسترس است و به زودی نسخه‌ی مخصوص مشاغل خاص همانند وکلا و … آن نیز به بازار عرضه خواهد شد. این محصول از دقت و سرعت بالا در تبدیل گفتار به متن و تایپ صوتی برخوردار است و همچنین این نرم افزار قابلیت بارگزاری انواع فایل‌های صوتی و تصویری را به کاربر می‌دهد.

در صورتی که درخواست دمو محصول فارس آوا را دارید به اینجا مراجعه کنید و در صورتی که می‌خواهید API محصول فارس آوا را دریافت نمایید این راهنما را مطالعه کنید.

محمد بازدید : 23 دوشنبه 05 اسفند 1398 نظرات (0)

تا بحال بارها راجع به فناوری تبدیل گفتار به نوشتار و کاربردهای آن در مقالات مختلف صحبت کرده ایم و در مورد دستیارهای صوتی که از فناوری تبدیل گفتار به نوشتار نیز در آن ها استفاده می شوند و لزوم استفاده از آن ها در اپلیکیشن ها نیز صحبت کردیم. اما امروز به طور اختصاصی  می خواهیم به این مسئله بپردازیم که فناوری تبدیل گفتار به نوشتار چگونه کار می کند و چطور یک ماشین می تواند صوت گفتاری را به نوشتار آن تبدیل کند.

تبدیل گفتار به نوشتار چیست؟

فناوری تبدیل گفتار به نوشتار در حقیقت زیر مجموعه ای از فناوری پردازش یا بازشناسی گفتار یا speech recognition  می باشد که می تواند صوتی که وجود دارد را (اعم از صحبت های افراد، صوت ضبط شده، صدای یک فیلم و…) به نوشتار تبدیل کند یا به عبارتی گفتار را تبدیل به نوشتار نماید.

فناوری تبدیل گفتار به نوشتار در حقیقت نوعی برنامه، اپلیکیشن، نرم افزار و… می باشد که محتوای صوتی را گرفته و با پردازش محتوای آن صوت، آن را به کلمات مکتوب تبدیل می نماید. فناوری تبدیل گفتار به نوشتار، همان طور که گفته شد یک فناوری بر پایه هوش مصنوعی می باشد که قادر است از یک گفت و گوی شفاهی و محتوای صوتی موجود، محتوای متنی تهیه کند و یا اینکه به صورت تایپ در لحظه به کار رود.

تبدیل گفتار به نوشتار چگونه کار می کند؟

تبدیل گفتار به نوشتار بخشی از فناوری بازشناسی گفتار می باشد که به سادگی میتوان مسئله بازشناسی گفتار را در این فرمول احتمالاتی شرطی خلاصه کرد:

فرمول احتمال شرطی برای تبدیل گفتار به نوشتار

به این معنی که ما به دنبال رشته‌ای از کلمات خروجی هستیم که با توجه به سیگنال ورودی موجود، محتمل‌ترین رشته کلمات خروجی را به ما نشان دهند. مسئله را می توان بر اساس این فرمول باز کرد و گفت که احتمال سیگنال، نسبت به رشته کلمات مورد نظر ضرب در احتمال کلمات. زمانی که این دو را باز کنیم، در واقع دو پایه اساسی یک سیستم بازشناسی گفتار به دست می آید که عبارتند از:
۱.مدل آکوستیکی
۲.مدل زبانی
کار مدل آکوستیکی آن است که تشخیص می دهد با توجه به سیگنال ورودی محتمل ترین آواهای خروجی چه چیزهایی هستند. کار مدل زبانی هم آن است که تشخیص دهد پس از ترکیب آواها، محتمل ترین کلماتی که در آن زبان می توانیم پشت سرهم داشته باشیم، چه هستند. این فرمول شاید ساده ترین و پایه‌ای ترین فرمول بازشناسایی گفتار باشد. در ساختار کلی یک سیستم بازشناسایی گفتار همه چیز از سیگنال صوتی شروع می شود.

سیگنال صوتی وارد یک سری پیش پردازش ها می شود. به عنوان مثال در زمانهایی که سکوت داریم، سیگنال صوتی را می بُریم یا نویز را کاهش می دهیم، استخراج ویژگی ها نیز بخشی از پیش پردازش می باشد. پس از اتمام پیش پردازش، سیگنال صوتی با یک سری ویژگی های کلی بدست می‌آید. در نهایت با ترکیب دو مدل زبانی و آکوستیکی، سیگنال یا ویژگی ها را به کلمات نهایی رمز گشایی (Decode) می کنیم.

ساختار سیستم های بازشناسایی گفتار

روش های بازشناسایی گفتار

به صورت کلی تلاشها یا روشهایی که در زمینه پردازش گفتار شده را میتوان به ۳ مقطع زمانی تقسیم کرد:

3 مدل بازشناسی گفتار

مدل گاوسین-مدل مخفی مارکف

مدلهای مخلوط گاوسین-مدل مخفی مارکف که به Gmm-Hmm نیز معروف می باشند،تا حدود 25 سال پیش بدون هیچ رقیب دیگری برای بازشنایایی گفتار استفاده می شدند تا زمانی که در مقاله معروف  سال ۲۰۰۶ که توسط یکی از افراد یسیار مهم در زمینه deep learning یعنی دکتر هینگتون ارائه شد، شبکه های عصبی باور عمیق یا DBN ها جایگزین مدل مخلوط گاوسین شدند. اما با این حال باز هم از مدل مخفی مارکف برای شبیه سازی زمانی استفاده می‌کردیم. در نهایت، طی سالهای اخیر مدل سرتاسری شبکه‌های عمیق بازگشتی معرفی شدند که دو مدل قبلی را باهم ترکیب کرده و در یک شبکه عمیق به کار می بردند.

شماتیک کلی این مدل ها را در می توانیم در تصویر زیر مشاهده کنیم. برای توضیح مختصر تصویر می توانیم بگوییم که ما در این مدل از سیگنال های صوتی که داریم یکسری ویژگی استخراج می کنیم. این ویژگی ها میتوانند expectogram یا nfcc باشند. با کمک مدل مخلوط گاوسین، یک آکوستیک مدلی را درست می کنیم و سپس از خروجی همان آکوستیک مدل، یا در واقع از آواهایی که بدست آمده در یک شبکه HMM، از آواهایی که وجود داشتندمدلسازی زمانی انجام می دهیم و در نهایت به متن می‌رسیم.

مدل مخلوط گاوسین-مارکف در بازشناسی گفتار

ساختار مدل شبکه عصبی باور عمیق-مدل مخفی مارکف

در شبکه های باور عمیق نیز همان اتفاق می افتد. ما میتوانیم expectogram و یا حتی ورودی خام سیگنال صوتی و MCC را داشته باشیم.تنها تفاوت آن با مدل قبلی آن است که بجای مدل گاوسین، از یک شبکه باور عمیق استفاده می کنیم.
تا قبل ۲۰۰۶ امکان اموزش شبکه های بزرگ وجود نداشت، در آن زمان همه ی افراد فعال در حوزه هوش مصنوعی می دانستند که با افزایش تعداد لایه‌ها قاعدتا می توانیم نتایج بهتری بگیریم و به اصطلاح به درک بالاتری از آن ورودی می رسیم. یعنی هرچه تعداد لایه ها زیادتر و عمیق تر باشد ما میتوانیم در عمق بیشتر درک بهتری از ورودی پیدا کنیم. اما امکان اموزش این شبکه ها به دو دلیل وجود نداشته‌است: اولین دلیل اینکه برای انجام این کار الگوریتمی وجود نداشته است و تا آن زمان ما تنها می توانستیم شبکه های ۲ تا ۳ لایه را آموزش دهیم.زمانی که عمق شبکه ها بیشتر می شد نیز از روش نشر بازگشتی استفاده می کردیم که توانایی انجام درست این کار را نداشت.
با این حال در سال ۲۰۰۶ الگوریتمی درست شد که با کمک آن می توانستند لایه ها را تک تک آموزش بدهند و سپس این لایه ها را بر روی هم سوار کردند و در نهایت به شبکه یک آموزش کلی داده شد. بعد از این اتفاق امکان آن به وجود آمد که به عنوان مثال بتوانیم ۶ تا ۷ لایه از شبکه های عصبی را با دقت خوبی آموزش دهیم. با آمدن این الگوریتم جای مدل مخلوط گاوسین یا GMM ها با شبکه های باور عمیق یا DBM تغییر کرد، اما ما همچنان از HMM ها یا مدل مارکف برای شبیه سازی مدل های زمانی استفاده می کردیم.

مدل شبکه عمیق-مارکف در پردازش گفتار

ساختار سرتا سری شبکه های عمیق بازگشتی

یکی از ساختارهای معروف شبکه های عمیق بازگشتی ساختاری همانند تصویر زیر دارد که متعلق به مقاله معروفی است که چند سال پیش توسط “بایدو” منتشر کرد. باتوجه به تصویری که در زیر مشاهده می کنید مرزهای قبلی را بین دو مدل مختلف قبلی نداریم و تمام این اتفاقات در شبکه سرتاسری می افتند، باز هم در اینجا ما expectogram یا ورودی و سپس یک شبکه عمیق بازگشتی را داریم. در واقع هم آواها (مدل آگوستیکی) را داریم و در واقع مدل آکوستیکی را آموزش میبینم و همزمان شبیه سازی زمانی را نیز انجام میدهیم.

شبکه سرتاسری عمیق در پردازش گفتار

بازشناسایی گفتار با روش های یادگیری عمیق

در این روش ما در واقع می خواهیم تمام مراحل قبلی که گفته شد را با یک شبکه جایگزین کنیم، یعنی سیگنال ورودی داخل یک شبکه ای شود و در نهایت خروجی آن سیگنال را به صورت متن داشته باشیم، بدون اینکه نیاز باشد آن سیگنال را به مدل های مختلف بشکانیم و استخراج ویژگی کنیم و… و در واقع می خواهیم یک شبکه سرتاسری در میانه داشته باشیم.

یادگیری عمیق در پردازش گفتار

فارس آوا، نرم افزاری که گفتار را به نوشتار تبدیل می کند

در حال حاضر در کشور نرم افزاری برای تبدیل گفتار به نوشتار وجود دارد که به کمک روش هایی که در بالا گفته شد،گفتار را به متن تبدیل می کند. فارس آوا دارای بزرگترین دیتاست فارسی در داخل کشور می باشد که شامل 10 هزار ساعت دیتای زبان فارسی می باشد.  فارس آوا عملیات بازشناسایی گفتار را به کمک روش های یادگیری عمیق انجام می دهد و این نرم افزار تبدیل گفتار به متن در زبان فارسی امکان ارتباط کلامی انسان با کامپیوتر و یا موبایل را فراهم می کند. این نرم افزار با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهره گیری از آخرین تکنولوژی های روز دنیا تولید شده است و به دلیل جمع آوری بزرگ ترین دیتاست موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهره مندی از تنوع گفتاری بسیار وسیع موفق شده تا در رقابت با شرکت های بزرگی چون گوگل ضریب دقت بالایی داشته باشد.

تبدیل گفتار به نوشتار فارس آوا

ویژگی ها و قابلیت های فارس آوا عبارتند از:

  • تبدیل گفتار به متن فارسی با دقت و سرعت بالا
  • بهره مندی از آخرین تکنولوژیهای یادگیری عمیق
  • تبدیل گفتار به متن بصورت همزمان (Real-Time)
  • تشخیص گفتار و صوت در محیط های نویزی
  • پشتیبانی از انواع لهجه ها و گویش ها
  • قابلیت تبدیل گفتار محاوره ای به متن
  • پشتیبانی از انواع فرمتهای صوتی و ویدیویی
  • تبدیل گفتار انگلیسی به متن انگلیسی
  • غیر وابسته به گوینده و عدم نیاز به آموزش برای هر فرد
  • توسعه و تولید بصورت کاملاً بومی در داخل کشور
  • ارائه API و SDK تبدیل گفتار به متن در قالب وب سرویس
  • ارائه پنل تحت وب برای آپلود کردن فایلها جهت پردازش
  • قابل نصب روی سرور مشتری و عدم نیاز اتصال به اینترنت
  • بهره مندی از دایره واژگان (فرهنگ لغت) بسیار وسیع

همه ی مواردی که گفته شد باعث شده تا فارس آوا به یکی از کاربردی ترین و با کیفیت ترین محصولات موجود در بازار امروز ایران، تبدیل شود. فارس آوا نرم افزاری است که به صورت اختصاصی برای زبان فارسی تولید شده است و واژگان زبان فارسی را به خوبی درک و پردازش می کند. شما می توانید با خیالی آسوده از نرم افزار فارس آوا استفاده کنید و راندمان و بهره وری کار خود و یا کارمندان در سازمان و یا کسب و کارتان را افزایش دهید. علاوه بر این ها فارس آوا از رابط کاربری بسیار ساده ای برخوردار است که این امر استفاده همه ی افراد از این نرم افزار را بسیار ساده می کند.

برای خرید محصول فارس آوا و یا درخواست دمو محصول به اینجا مراجعه کنید.

محمد بازدید : 29 دوشنبه 21 بهمن 1398 نظرات (0)

قبلا هم با شما درباره ی دلایل نیاز به نرم افزارهای تبدیل گفتار به نوشتار صحبت کرده بودیم. در مقاله امروز قصد داریم تا ویژگی های یک نرم افزار تبدیل گفتار به نوشتار کاربردی را توضیح دهیم و برای افرادی که نیاز به یک نرم افزار تبدیل گفتار به نوشتار کاربردی دارند یک راهنما برای انتخاب صدها نرم افزار موجود در بازار ارائه دهیم.

چرا به تبدیل گفتار به نوشتار بر روی دسکتاپ نیاز داریم؟

اگر به سراغ این مقاله آمده اید که حتما جواب را از قبل می دانید زیرا که دقیقا نیازتان به یک نرم افزار تبدیل گفتار به نوشتار شما را تا به این جا کشانده است. اگر بخواهیم نیازهای مختلفی که منجر به استفاده از نرم افزارهای تبدیل گفتار به نوشتار می شود را بگوییم، باید این مقاله را تنها به این موضوع اختصاص دهیم. اما عمده ترین دلایلی که افراد را به دنبال نرم افزارهای تبدیل گفتار به نوشتار می کشاند، کار و شغل است.

شغل های مختلف ممکن است نیازهای متفاوتی به وجود بیارد که بخشی از پاسخ به این نیاز ها به استفاده از فناوری تبدیل گفتار به نوشتار باز می گردد. ممکن است فردی شغل نویسندگی داشته باشد و دائما با نوشتن سر و کار داشته باشد و به همین دلیل نیاز به تبدیل گفتار به نوشتار داشته باشد. ممکن است سازمانی آرشیو صوتی داشته باشد که نیاز باشد آن را در زمان کوتاهی تبدیل به متن کند. ممکن است فردی در شغلش دائما نیاز داشته باشد که فایل های صوتی مصاحبه ها و یا جلسات را به متن تبدیل کند و هزار و یک نیاز دیگر.

چرا از نرم افزار تبدیل گفتار به نوششتار استفاده می کنیم

شاید شما جزء افرادی باشید که برای تبدیل گفتار به نوشتار از نرم افزارهای مختلفی استفاده کرده اید اما آن ها جوابگوی نیاز شما نبوده اند و در انتها حس کردید که زمان و هزینه تان را هدر داده اید. به همین دلیل است که قبل از خرید و استفاده از یک نرم افزار تبدیل گفتار به نوشتار باید با ویژگی هایی که به آن کیفیت می بخشد آشنا شوید. ما در ادامه این ویژگی ها را برای شما بر می شماریم.

ویژگی هایی که یک نرم افزار تبدیل گفتار به نوشتار برای دسکتاپ را بهترین می کند

برای استفاده از یک نرم افزار تبدیل گفتار به نوشتار باید به چندین فاکتور اصلی توجه کنیم. توجه به این فاکتورها باعث می شود تا قبل از خرید و استفاده از نرم افزار، از کیفیت انتخاب خود تا حدودی مطلع باشیم.

دقت در عملکرد تبدیل گفتار به نوشتار

ناگفته واضح است که یکی از ویژگی های پر اهمیتی که نرم افزار تبدیل گفتار به متن باید دارای آن باشد، دقت است. این دقت در عملکرد و فهم محتوای صوتی به عوامل مختلفی بستگی دارد. یکی از این عوامل کیفیت اطلاعاتی است که از قبل به نرم افزار داده شده و کیفیت روند آموزش نرم افزار مبتنی بر هوش مصنوعی می باشد. البته عوامل خارجی مانند وجود نویز و یا آمبیانس زیاد محیطی که فایل صوتی در آن ضبط شده است و یا کیفیت میکروفون نیز در میزان دقت نرم افزار تاثیر گذار است. با بررسی تمام این عوامل و ترکیب آن ها در ارائه خروجی نهایی نرم افزار می توانید به میزان دقت آن در تبدیل گفتار به متن پی ببرید.

صحت و درستی در تبدیل گفتار به نوشتار

یکی از فاکتورهای در سنجش میزان کاربردی بودن یک نرم افزار تبدیل گفتار به نوشتار، میزان صحت و درستی خروجی نرم افزار است. میزان صحت و درستی هر نرم افزار به عوامل مختلفی باز می گردد که توضیح آن تا حدودی تخصصی می باشد. برای اینکه شما بتوانید قبل از خرید از میزان صحت و درستی خروجی نرم افزار مطمئن شوید بهتر است مدت کوتاهی به صورت امتحانی با آن کار کنید و بررسی کنید که چه میزان محتوای فایل صوتی و خروجی نهایی نزدیک به هم هستند و درصد خطای آن را بسنجید. البته نکته ای که وجود دارد این است که هنوز هیچ نرم افزار تبدیل گفتار به نوشتاری تولید نشده که درصد خطای صفر داشته باشد اما اگر میزان خطای آن از نظر شما قابل قبول بود، می توانید با خیال راحت آن نرم افزار تبدیل گفتار به نوشتار را خریداری نموده و  استفاده نمایید.

سرعت تبدیل گفتار به نوشتار

یکی دیگر از فاکتورهای مهم سرعت پردازش صوت و تبدیل آن به متن می باشد. شما برای آن که سرعت کار خودتان را بالاتر ببرید از نرم افزار تبدیل گفتار به متن استفاده می کنید، پس قبل از هر چیزی مطمئن شوید که نرم افزار مورد نظر، تبدیل گفتار به نوشتار را با سرعت مطلوبی انجام می دهد.

استفاده از نرم افزار تبدیل گفتار به نوشتار

دایره واژگان فارسی وسیع برای تبدیل گفتار به نوشتار

نرم افزار تبدیل گفتار به متن مبتنی بر هوش مصنوعی تنها زمانی خوب کار می کند و  خروجی مناسبی به شما می دهد که با داده های با کیفیت و خوبی آموزش داده شده باشد. هرچه میزان این داده ها و اطلاعات بیشتر باشد، میزان درک نرم افزار از آن چه که می شنود و بالطبع کیفیت پردازش و در نهایت صحت و درستی متن خروجی آن بالا می رود. پس در زمانی که قصد خرید یک نرم افزار تبدیل گفتار به نوشتار را دارید حتما توجه کنید که دایره واژگان نرم افزار گسترده و وسیع باشد.

رابط کاربری ساده و عدم نیاز به آموزش برای یادگیری نحوه استفاده از نرم افزار تبدیل گفتار به نوشتار

به این نکته توجه کنید که قرار است بعد از خرید، در کارتان زمان زیادی از نرم افزار تبدیل گفتار به نوشتار استفاده کنید. به همین دلیل اگر رابط کاربری نرم افزار بسیار پیچیده باشد، قطعا بعد از مدتی از کار کردن با آن خسته خواهید شد. به همین دلیل از لازمه های یک نرم افزار تبدیل گفتار به متن کاربردی، رابط کاربری ساده آن است. شما باید از نرم افزاری استفاده کنید که قبل از کار کردن با آن نیازی به آموزش دیدن نداشته باشید تا با هر سطح از سوادی بتوانید به راحتی با آن ارتباط بر قرار کرده و از مزایای آن بهره مند شوید.

فهم لهجه و گویش های مختلف برای تبدیل گفتار به نوشتار

یکی از ویژگی های مهم نرم افزار تبدیل گفتار به نوشتار قدرت درک و فهم گویش های مختلف می باشد. زبان فارسی دارای گویش های مختلفی است و یک نرم افزار با کیفیت و کاربردی مناسب باید بتواند اطلاعات موجود در صوت را به درستی استخراج کرده و آن ها را تبدیل به متن نماید، فارغ از هر نوع گویش یا لهجه ای.

معرفی فارس آوا، کاربردی ترین نرم افزار تبدیل گفتار به نوشتار برای دسکتاپ

با توجه به تمام مواردی که گفته شد، اگر به دنبال یک نرم افزار کاربردی و با کیفیت تبدیل گفتار به نوشتار در دسکتاپ برای زبان فارسی هستید، ما فارس آوا را به شما معرفی می کنیم. فارس آوا، نرم افزار تبدیل گفتار به متن در زبان فارسی است که امکان ارتباط کلامی انسان با کامپیوتر و یا موبایل را فراهم می کند. این نرم افزار با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهره گیری از آخرین تکنولوژی های روز دنیا تولید شده است و به دلیل جمع آوری بزرگ ترین دیتاست موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهره مندی از تنوع گفتاری بسیار وسیع موفق شده است تا در رقابت با شرکت های بزرگی چون گوگل دارای ضریب دقت بالایی باشد.

فارس آوا نرم افزار کاربردی تبدیل گفتار به نوشتار

ویژگی ها و قابلیت های فارس آوا عبارتند از:

  • تبدیل گفتار به متن فارسی با دقت و سرعت بالا
  • بهره مندی از آخرین تکنولوژیهای یادگیری عمیق
  • تبدیل گفتار به متن بصورت همزمان (Real-Time)
  • تشخیص گفتار و صوت در محیط های نویزی
  • پشتیبانی از انواع لهجه ها و گویش ها
  • قابلیت تبدیل گفتار محاوره ای به متن
  • پشتیبانی از انواع فرمتهای صوتی و ویدیویی
  • تبدیل گفتار انگلیسی به متن انگلیسی
  • غیر وابسته به گوینده و عدم نیاز به آموزش برای هر فرد
  • توسعه و تولید بصورت کاملاً بومی در داخل کشور
  • ارائه API و SDK تبدیل گفتار به متن در قالب وب سرویس
  • ارائه پنل تحت وب برای آپلود کردن فایلها جهت پردازش
  • قابل نصب روی سرور مشتری و عدم نیاز اتصال به اینترنت
  • بهره مندی از دایره واژگان (فرهنگ لغت) بسیار وسیع

همه ی مواردی که گفته شد باعث شده تا فارس آوا به یکی از کاربردی ترین و با کیفیت ترین محصولات موجود در بازار امروز ایران، تبدیل شود. فارس آوا نرم افزاری است که به صورت اختصاصی برای زبان فارسی تولید شده است و واژگان زبان فارسی را به خوبی درک و پردازش می کند. شما می توانید با خیالی آسوده از نرم افزار فارس آوا استفاده کنید و راندمان و بهره وری کار خود و یا کارمندان در سازمان و یا کسب و کارتان را افزایش دهید. علاوه بر این ها فارس آوا از رابط کاربری بسیار ساده ای برخوردار است که این امر استفاده همه ی افراد از این نرم افزار را بسیار ساده می کند.

 

برای خرید محصول فارس آوا و یا درخواست دمو محصول به اینجا مراجعه کنید.

محمد بازدید : 21 سه شنبه 15 بهمن 1398 نظرات (0)

حتما تا به حال بارها برای شما پیش آمده که در حال نوشتن باشید و به این فکر کنید که کاش می توانستم آنچه را که می نویسم را به کسی دیکته کنم. یا بارها شده که نیاز داشتید آن چه را که می شنوید، بنویسید و چون سرعت بیان کلمات بالا بود نیاز به یک دستیار یا نرم افزاری داشتید تا آن چه را در لحظه به متن تبدیل نمایید. اگر با چنین مواردی برخورد داشتید یا در کار و حرفه تان به نرم افزاری نیاز دارید که بتواند هر آنچه می شنود را به متن تبدیل کند، باید بگوییم که هوش مصنوعی چند سالی است که فناوری تبدیل گفتار به نوشتار را برای شما به ارمغان آورده است. اگر می خواهید با فناوری تبدیل گفتار به نوشتار بیشتر آشنا شوید، در ادامه با ما همراه باشید.

فناوری تبدیل گفتار به نوشتار چیست؟

فناوری تبدیل گفتار به نوشتار در حقیقت یک زیر مجموعه ای از فناوری شناخت گفتار یا speech recognition می باشد که می تواند صوتی که وجود دارد را (اعم از صحبت های افراد، صوت ضبط شده، صدای یک فیلم و…) به نوشتار تبدیل کند یا به عبارتی گفتار را تبدیل به نوشتار نماید.

asr-lp_block-1._CB499320415_

فناوری تبدیل گفتار به نوشتار در حقیقت نوعی برنامه، اپلیکیشن، نرم افزار و… می باشد که محتوای صوتی را گرفته و با پردازش محتوای آن صوت، آن را به کلمات مکتوب تبدیل می نماید. فناوری تبدیل گفتار به نوشتار، همان طور که گفته شد یک فناوری بر پایه هوش مصنوعی می باشد که قادر است از یک گفت و گوی شفاهی و محتوای صوتی موجود، محتوای متنی تهیه کند و یا اینکه به صورت تایپ در لحظه به کار رود.

از فناوری تبدیل گفتار به نوشتار چه استفاده ای می توان کرد؟

به طور کلی فناوری تبدیل گفتار به نوشتار برای هر کسی که به نوعی با نوشتار سر و کار دارد، کاربردی می باشد. به عبارتی می توان گفت این فناوری مبتنی بر هوش مصنوعی هر آن چه را که می شنود در لحظه به صورت نوشتار تبدیل می نماید. با این رویکرد می توان گفت فناوری تبدیل گفتار به نوشتار در تمامی زمینه ها کاربردی می باشد، زیرا امروزه زندگی و کار ما آن چنان با تکنولوژی، کامپیوتر و گوشی های هوشمند گره خورده که می توان گفت بخش زیادی از زمان روزانه ما صرف تایپ و نوشتن می شود.

البته پر واضح است که به میزان ضرورت ها، میزان تایپ کردن ما متغیر است و به همین ترتیب میزان نیاز ما به فناوری تبدیل گفتار به نوشتار متفاوت می باشد. همان طور که گفته شد استفاده از این فناوری برای همه کاربردی است اما در برخی مشاغل ضروری و بسیار کاربردی می باشد. برای مثال افرادی که شغل آن ها به گونه ای است که با تایپ کردن و نوشتن بسیار سر و کار دارند یا کسانی که نیاز دارند از آرشیوهای صوتی موجود متن آن ها را استخراج نمایند. فناوری تبدیل گفتار به نوشتار تنها برای کسب و کارهایی که با نوشتار سر و کار دارند نمی باشد، بلکه برای کسب و کارهایی که دارای حجم زیادی از داده های صوتی هستند که نیاز است آن را تبدیل به نوشتار نمایند بسیار مناسب است. برای مثال در مراکز تماس، در مراکز پشتیبانی و …. که نیاز است از محتوای صورتی موجود، متن تهیه شود.

voice-technology-assistants-1-e1563557148164-1800x0-c-default-min

فناوری تبدیل گفتار به نوشتار به طور اختصاصی می تواند برای افراد کم توان کاربردی باشد. در ابتدا نیز فناوری تبدیل گفتار به متن به عنوان فناوری ای برای کمک به کم شنوایان توسعه داده شده بود. به طور کلی این افراد برای انجام هر گونه فعالیتی که به نوشتار مربوط می شود (مانند پیام دادن، تایپ صحبت ها و دستورات صوتی و…) می توانند از تبدیل گفتار به نوشتار استفاده نمایند.

کاربردهای فناوری تبدیل گفتار به نوشتار در حوزه های مختلف

همانطور که گفته شد فناوری تبدیل گفتار به نوشتار کاربردهای بسیار زیادی در حوزه های مختلف دارد. در ادامه به طور اختصاصی به کاربرد این فناوری در حوزه های به خصوصی می پردازیم:

voice-recognition-750x450-min

نویسندگان

کاربرد تبدیل گفتار به نوشتار برای این حوزه کاملا شناخته شده و قابل پیش بینی می باشد. همه ی افرادی که حرفه ی آن ها به نوعی با نوشتن و نویسندگی سر و کار دارند می توانند از این فناوری استفاده نمایند.

مراکز پشتیبانی و ارائه اطلاعات تمامی کسب و کارها

کسب و کارهایی که دارای مراکز پشتیبانی هستند به نوعی نیاز به مکتوب کردن صحبت های رد و بدل شده در تماس ها دارند. برای این کار، فناوری تبدیل گفتار به نوشتار در این حوزه بسیار کاربردی می باشد.

 مراکز تماس سازمان ها و کسب و کارها

کاربرد تبدیل گفتار به نوشتار در مراکز تماس و ارائه اطلاعات نیز می تواند مکتوب کردن گفت و گوها در لحظه باشد. هم چنین این فناوری با مکتوب کردن گفت و گوهای تماس گیرنده ها می تواند به فهم بهتر سوالات و صحبت های مشتریان و پاسخگویی بهتر کمک کند.

مکتوب سازی آرشیوهای صوتی

از فناوری تبدیل گفتار به متن می توان برای مکتوب کردن و مستند سازی آرشیوهای صوتی استفاده نمود. افراد و سازمان هایی که دارای آرشیوهای صوتی بزرگ و کوچکی هستند و نیاز دارند تا برای ذخیره سازی محتوای آن ها را به نوشتار تبدیل کنند، می توانند از فناوری تبدیل گفتار به نوشتار استفاده نمایند.

علاوه بر حوزه هایی که در بالا گفته شد، فناوری تبدیل گفتار به نوشتار به طور کلی برای استفاده در تمامی کسب و کارها یا کارهای شخصی که به نوشتن و تایپ کردن نیاز دارند، کاربردی می باشد.

فارس آوا، سرویس تبدیل گفتار به نوشتار فارسی شرکت عامر اندیش هوشمند

فارس آوا، نرم افزار تبدیل گفتار به متن در زبان فارسی است که امکان ارتباط کلامی انسان با کامپیوتر و یا موبایل را فراهم می کند. این نرم افزار با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهره گیری از آخرین تکنولوژی های روز دنیا تولید شده است و به دلیل جمع آوری بزرگ ترین دیتاست موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهره مندی از تنوع گفتاری بسیار وسیع موفق شده است تا در رقابت با شرکت های بزرگی چون گوگل دارای ضریب دقت بالایی باشد.

فارس آوا به دلیل اینکه به طور اختصاصی برای زبان فارسی تولید شده است، بر روی تبدیل گفتار به نوشتار در زبان فارسی بسیار دقیق و کامل می باشد. سازمان ها و کسب و کارهای داخلی که به نرم افزاری برای تبدیل محتوای صوتی فارسی به متن نیاز دارند، می توانند به محصول فارس آوا اطمینان کنند و از آن استفاده نمایند.

چنانچه در کسب و کار خود به فناوری تبدیل گفتار به نوشتار نیاز دارید و درخواست دموی محصول فارس آوا شرکت عامر اندیش را دارید، می توانید به اینجا مراجعه کنید.

محمد بازدید : 21 دوشنبه 07 بهمن 1398 نظرات (0)

با وجود پیشرفت هایی که تکنولوژی داشته، شاید بی راه نباشد اگر بگوییم که یکی از کارهایی که در سال های آینده از بین خواهد رفت تایپ کردن باشد. در سال های اخیر نوآوری های بسیاری در تکنولوژی و فناوری به وجود آمده است که تغییرات بسیاری را در عادت های افراد و نحوه استفاده آن ها از تکنولوژی به وجود آورده است. یکی از این تغییرات علاقه افراد به استفاده از دستورات صوتی، تایپ صوتی و هر چیزی که به جای تایپ از تبدیل صوت به متن استفاده کند، می باشد.

امروزه گجت هایی مثل الکسا و دستیار های هوشمندی مانند سیری و گوگل، باعث شده اند تا نحوه برخورد مردم با گوشی های هوشمند تا حدود زیادی تغییر کند. به همین دلیل اینکه می گوییم در آینده ای نزدیک تایپ کردن فراموش می شود یا اینکه حداقل دیگر ترجیح یا اجبار افراد نمی باشد، حرف بی راهی نیست. در همین راستا قطعا در آینده ترجیح افراد استفاده از اپلیکیشن هایی خواهد بود که به تایپ کمتری نیاز خواهد داشت.

speech-to-text-definition-660x330-min.jpeg

معمولا زمانی که افراد به دنبال تولید و ارائه محصولی هستند، یکی از مواردی که باید در نظر داشته باشند، ترندها و علایق افرادی است که می خواهند از این محصول استفاده کنند. زمانی هم که قرار است محصولی که ارائه می دهند با تکنولوژی آمیخته باشد، این مسئله حساس تر و مهم تر می شود، چون نوآوری های بسیاری در این زمینه وجود دارد و شما باید هر روز به دنبال آپشن های جدیدی باشید که کاربران آن ها را می خواهند.

همان طور که از عنوان این مقاله پیداست ، ما می خواهیم در این مقاله بپردازیم به این موضوع که چرا باید به اپلیکیشن خود تایپ صوتی اضافه کنیم. در ابتدا بیایید ببینیم تایپ صوتی دقیقا به چه معناست؟

تایپ صوتی چیست؟

اگر بخواهیم توضیح ساده ای از تایپ صوتی بدهیم، می توانیم بگوییم توانایی است که بدون تایپ کردن بنویسیم. برای تایپ صوتی ما در حقیقت از فناوری تبدیل گفتار به نوشتار استفاده می کنیم که این فناوری از هوش مصنوعی بهره می گیرد تا آنچه که در یک گفت و گوی شفاهی می شنود را به متن تبدیل کند. پر واضح است که از تایپ صوتی و فناوری تبدیل گفتار به نوشتار می توان برای تمام کارهایی که لازمه آن نوشتن است، استفاده کرد.

speech-to-text-software.png

با این تفاسیر تایپ صوتی در واقع یعنی ما برای گوشی هوشمند یا هر وسیله ی هوشمندی که با آن کار می کنیم، دیکته بگوییم و او هر آن چه می شنود را به صورت متن تحویل دهد. می توان از تایپ صوتی برای استفاده های مختلفی در یک اپلیکیشن بهره برد و متناسب با نیازهای جامعه هدف و نظر تولید کننده اپلیکیشن کاربردهای مختلفی برای آن تعریف کرد.

چرا باید از تایپ صوتی استفاده کرد؟

با توجه به آنچه که تا الان گفته شد فهمیدیم که تایپ صوتی کاربردهای زیادی دارد و اگر بر روی اپلیکیشن خود قابلیت تایپ صوتی را اضافه کنیم، کاربرها آن را دوست خواهند داشت! اما این که کاربران فقط تایپ صوتی را دوست داشته باشند دلیل منطقی ای برای متحمل شدن هزینه برای اضافه کردن این قابلیت نمی شود. این حرف بسیار درست است. اما باید بگوییم که تایپ صوتی قرار نیست در آینده هم فقط یک قابلیت خوشایند بر روی اپلیکیشن شما باشد، بلکه قرار است تعیین کند که شما در میدان رقابت خواهید ماند یا نه. در ادامه تعدادی دلیل برای شما شرح می دهیم.

The-most-accurate-speech-to-text-app-of-2019-way-with-words-min.jpgتایپ صوتی یک ترند خواهد شد

همان طور که قبلا نیز به آن اشاره کردیم، با پیشرفت تکنولوژی و قوی تر شدن موتورهای تبدیل گفتار به نوشتار، و هم چنین تغییراتی که در سبک زندگی مردم ایجاد شده ، در آینده ای نزدیک تایپ صوتی قطعا یک ترند خواهد بود و یکی از مواردی که برای ساخت اپلیکیشن ها باید در نظر بگیریم. اما شاید بپرسید به چه دلیل و چرا؟ جواب ما هم این خواهد بود که به اطرافتان بیشتر توجه کنید. هر چه بیشتر می گذرد مردم بیشتر به دنبال چیزهایی هستد که زمان کمتری از آن ها بگیرد. در حال حاضر افراد به دنبال چیزی هستند که سریع تر بدست بیاید و حوصله آنچه که وقت زیادی بگیرد را ندارند. حالا با این اوصاف به چیزی فکر کنید که افراد روزانه زمان زیادی را صرف آن می کنند. بله درست است، تایپ کردن. با وجود مصرف زیاد از شبکه های اجتماعی و پیام رسان ها و… افراد زمان زیادی را برای تایپ کردن، حالا چه به منظور پیام دادن یا نوشتن و سرچ کردن و… ، صرف می کنند. حالا فکر کنید یک روزی محصولی به چنین افرادی ارائه دهید که این حجم از صرف وقت را برای آن ها کاهش دهد. یقینا چنین محصولی محبوبیت زیادی پیدا خواهد کرد. با توجه به اینکه در حال حاضر هم تایپ صوتی در میان بسیاری از افراد محبوب است.

افراد بیشتر تمایل دارند تا ابزارهایی که از voice بهره می برند را استفاده کنند

به این موارد توجه کنید:

  • بر اساس گفته گوگل، 20 درصد سرچ ها از طریق voice انجام می شوند.
  • 65 درصد کسانی که از آمازون اکو و گوگل هوم استفاده می کنند گفته اند که دیگر نمی خواهند به دوران قبل از استفاده از آن ها باز گردند.
  • 31 درصد از کاربران در دنیا حداقل هفته ای یک بار از تکنولوژی مربوط به voice استفاده می کنند.
  • 7 درصد از افراد بالغ در آمریکا از voice برای سرچ استفاده می کنند.
  • تا سال 2020 نصف تمام جست و جوهای آنلاین در دنیا بر اساس voice خواهد بود.
  • و…

اگر بخواهیم موارد بالا را ادامه دهیم، قطعا به لیستی بالغ بر 30 تا 40 مورد می رسیم. تمام این آمارها نشان می دهد افراد تمایل پیدا کرده اند تا از voice برای انجام کارهایی مانند سرچ، نوشتن، انجام دستورات صوتی و… استفاده نمایند. همه این ها در کر آنچه که در مورد قبلی گفته شد، نشان می دهد که تجهیز صوتی اپلیکیشن ها به فهم صوتی دستورات، در آینده ای نه چندان دور، نه تنها یک ترند و یک مزیت رقابتی بلکه به یک ضرورت تبدیل خواهد شد.

صرفه جویی در زمان افراد با استفاده از تایپ صوتی

همانطور که گفته شد یکی از مزیت های بزرگ تایپ صوتی صرفه جویی در زمان و وقت افراد است. قطعا افراد به استفاده از اپلیکیشنی که در زمان آن ها صرفه جویی کند علاقه بیشتری نشان خواهند داد.

UfLHB5jH8PVO1RtPu88DDQ.pngکمک به افرادی که نمی توانند به خوبی بنویسند با استفاده از تایپ صوتی

این نکته بسیار مهم است. زیرا که باعث می شود چند دسته از افراد که نمی توانند به خوبی از اپلیکیشن های مخصوص گوشی های هوشمند بهره ببرند به سراغ اپلیکیشن شما خواهند آمد. این سه مورد شامل افرادی است که توانایی خواندن و نوشتن ندارند، کودکانی است که نمی توانند بخوانند و بنویسند و دیگر افراد کم توانی که قابلیت تایپ کردن را ندارند. با فعال کردن و استفاده کردن از این قابلیت بر روی اپلیکیشن خود، می توانید کاری کنید که این افراد بتوانند با فراغ بال و خیالی راحت به سراغ اپلیکیشن شما بیایند.

ایجاد تجربه کاربری فوق العاده

همه ی آنچه که تا به الان گفته شد در نهایت منجر به یک تجربه کاربری عالی می شود. توجه به نیاز افراد و علایق آن ها، توجه به اینکه قرار است از چه چیزی استفاده کنند و تمایل دارند چه چیزی را به کار ببرند، توجه به اینکه زمانی که از اپ شما استفاده می کنند حوصله شان سر نرود و حس نکنند زمانشان را هدر داده اند، توجه به همه ی کاربرانی که قرار است از اپلیکیشن شما استفاده کند، همه و همه باعث می شود که تجربه کاربری بسیار عالی برای فردی که از اپلیکیشن شما استفاده می کند به ارمغان بیاورد و نه تنها خود او مشتری و طرفدار پر و پا قرص شما شود بلکه این تجربه عالی باعث شود که خود او اپلیکیشن شما را به دیگران معرفی کند.

فارس آوا، کمک شما برای استفاده از تایپ صوتی

با گفتن همه این ها شاید حالا که تمایل پیدا کرده اید تا از قابلیت تایپ صوتی در اپلیکیشن خود استفاده کنید، چیزی که فکر شما را درگیر خود کرده است، آن باشد که چگونه این قابلیت را پیاده سازی کنید. خوب جواب ساده است. شما دو راه پیش رویتان دارید. یکی اینکه خودتان اقدام کنید به تولید محصول بر اساس هوش مصنوعی و هزینه های سنگین تولید و جمع آوری دیتا را متقبل شوید و یا اینکه از سرویس های هوش مصنوعی که شرکت دیگری ارائه می دهد و کیفیت قابل قبولی دارد استفاده کنید.

 محصول فارس آوا، یک نرم افزار برای تبدیل گفتار به متن در زبان فارسی است که امکان ارتباط کلامی انسان با کامپیوتر و یا موبایل را فراهم می کند. این نرم افزار با تکیه بر دانش هوش مصنوعی و با بهره گیری از آخرین تکنولوژی های روز دنیا تولید شده است و به دلیل جمع آوری بزرگ ترین دیتاست موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهره مندی از تنوع گفتاری بسیار وسیع موفق شده است تا در رقابت با شرکت های بزرگی چون گوگل دارای ضریب دقت بالایی باشد. محصول فارس آوا علاوه بر آنچه که گفته شد قابلیت تبدیل متن به گفتار و استخراج کلمات کلیدی را نیز دارا می باشد. 

محمد بازدید : 33 چهارشنبه 02 بهمن 1398 نظرات (0)

هرچه پیش می رویم زندگی و شغل ما با کامپیوتر و تکنولوژی گره می خورد. با وجود گوشی های هوشمند و لب تاپ ها تایپ کردن تبدیل به یکی از راه های برقراری ارتباط ما با دیگران شده است و با تایپ کردن دانسته هایمان را مستند کرده و یا خاطراتمان را ثبت می کنیم. همه ی ما روزانه کارهای مختلفی برای انجام دادن داریم و نمی توانیم زمان زیادی را به تایپ کردن و نوشتن بگذرانیم. زمان هایی نیز وجود دارد که ما نیاز داریم تا حجم زیادی را یادداشت کنیم و پس چه بهتر می شد که برنامه ای این کار را به عهده می گرفت و گفتار را به نوشتار تبدیل می کرد.

با پیشرفت فناوری، بحث کمک گرفتن از هوش مصنوعی برای تبدیل گفتار به نوشتار مطرح شد. در چند سال اخیر با تولید نرم افزار ها و اپلیکیشن های تبدیل گفتار به نوشتار، این فناوری در اختیار افرادی که به آن نیاز دارند قرار داده شده و با استفاده از برنامه های تبدیل گفتار به نوشتار مبتنی بر هوش مصنوعی افراد می توانند از هر لحظه که به آن نیاز داشتند بتوانند از آن استفاده کنند.

چرا از تبدیل گفتار به نوشتار استفاده می کنیم و تبدیل گفتار به نوشتار چیست؟

فناوری تبدیل گفتار به نوشتار در حقیقت فناوری شناخت زبان بر پایه هوش مصنوعی است که می تواند گفت و گوی شفاهی را به صورت اتوماتیک به نوشتار تبدیل کند.  فناوری تبدیل گفتار به نوشتار قادر است تا هر نوع محتوای صوتی را به نوشته تبدیل کند. گفتار به نوشتار در حقیقت به نوعی فناوری بین رشته ای زبان شناسی-رایانه می باشد و از دل علوم زبان شناسی، کامپیوتر و الکترونیک پدید آمده است.

همه افراد به نرم افزارهای گفتار به نوشتار برای انجام کارهایی که لازمه آن نوشتن است نیاز دارند اما بیش از همه برای کسانی مناسب است که در کارهایشان به نوعی نیاز دارند تا دائما بنویسند. با حذف زمانی که برای تایپ کردن مصرف می شود، این فناوری در زمان بسیار صرفه جویی می کند. با استفاده از سیستم های تبدیل گفتار به نوشتار تنها کافی است که برای کامپیوتر یا گوشی هوشمند خود دیکته بگویید تا او آن چه می شنود را آنالیز کند و بنویسد.

coding-on-a-screen

تبدیل گفتار به نوشتار، فناوری کاربردی برای کمک به کم توانان

فناوری تبدیل گفتار به نوشتار تا حد زیادی برای افرادی که دارای کم توانی هستند و قادر نیستند به راحتی بنویسند کمک خواهد بود. امروزه بسیار از گوشی های هوشمند و دستگاه های هوشمند به این فناوری مجهز هستند و همین امر دسترسی به موتورهای تبدیل گفتار به متن بسیار راحت تر می کند.

تبدیل گفتار به نوشتار چگونه کار می کند؟

بسیاری از نرم افزار های تبدیل گفتار به نوشتار خروجی مشابهی دارند و در نهایت یک کار را انجام می دهند. الگوریتم‌های یادگیری عمیق برای تبدیل گفتار به متن غالبا بدین شکل عمل می‌کنند که ابتدا ویژگی‌های مشخصی را از گفتار استخراج می‌کنند، سپس با کمک مدل آموزش داده شده این ویژگی‌ها را به دنباله‌ای از واج‌های احتمالی تبدیل می‌کنند و سپس به کمک مدل زبانی این واج‌ها را به رشته‌ای متنی تبدیل می‌کنند.

speech_to_text_process

برخی از نرم افزارهای تبدیل گفتار به متن نیاز دارند تا آموزش داده شوند. برای این کار یک کاربر باید متن یا کلمات را جدا جدا بخواند تا سیستم صدای او را تجزیه و تحلیل کند و از این طریق آموزش ببیند تا آن را بشناسد. این امر باعث بالا رفتن دقت سیستم می شود و سیستم ها پس از آموزش قادرند تا مستقل از کاربر کار کنند.

مزایای استفاده از موتورهای تبدیل گفتار به متن

در طول متن بارها به مزایای استفاده از موتورهای تبدیل گفتار به متن اشاره شد. در ادامه نیز شماری از مزایای برجسته استفاده از این سیستم ها اشاره می شود:

افزایش در سرعت انجام کارها

یک فرد معمولی می تواند در هر دقیقه به طور میانگین 38 تا 40 کلمه را تایپ کند که با این محاسبات در هر ساعت می تواند 2400 کلمه را تایپ کند. چنان چه این روش سنتی و قدیمی با موتورهای تبدیل گفتار به نوشتار جایگزین شود، سرعت تایپ کردن به 4 برابر این مقدار خواهد رسید. یعنی به طور میانگین در هر دقیقه 150 کلمه. این مسئله را می توان بزرگترین مزیت فناوری تبدیل گفتار به نوشتار دانست.

افزایش پویایی

با استفاده از تکنولوژی دیگر لازم نیست زمان زیادی را بنشینید و تایپ کنید. به جای آن می توانید این زمان ها را به انجام کارهای خلاقانه و پویا تری بپردازید که راندمان کار و خلاقیت در کار را افزایش می دهد. این پویایی هم چنین می تواند به تحرک بیشتر شما و سلامتی شما کمک کند.

دقت بالاتر

این که مستقیما با نرم افزاری صحبت کنید و آن نرم افزار مستقیما گفته های شما را بنویسد درصد خطای اشتباه نوشتن و یا غلط دیکته ای را تا حد چشم گیری کاهش می دهد. درصد خطای یک تایپیست معمولی بین 8 کلمه در 100 کلمه می باشد که نیاز دارد که دوباره درست شوند.

افزایش تمرکز

با استفاده از سیستم های تبدیل گفتار به نوشتار، قطعا متوجه خواهید شد که تمرکز بیشتری درحین انجام کارتان دارید. این کار کمک می کند تا بر روی مسئله ای که در مورد آن صحبت می کنید متمرکز تر شوید و راحت تر آن چه در ذهنتان می گذرد را به نوشتار تبدیل کنید

نزدیکی بیان و نوشته

تا به حال برای شما پیش آمده که درحال نوشتن حس کنید نوشته تان معقول نیست؟ یا اینکه سبک نوشته به درستی رعایت شده و یا بیش از حد خشک نوشته شده ؟ در هنگام بیان آن چه می خواهدی بنوسید می توانید راحت تر آن چه که در ذهنتان می گذرد را بیان کنید و با تبدیل به نوشتار به صورت همزمان می توانید چیزی که در فکرتان می گذرد را سریعا بنویسید.

کاهش مشکلات بدنی

همه می دانیم با نشستن طولانی مدت پشت کامپیوتر برای تایپ کردن، هم بیماری هایی مانند کمر درد به سراغمان می آید و هم خیره شدن طولانی مدت به مانیتور باعث خشکی چشم و دردسر های دیگری می شود که سلامتی ما را به خطر خواهد انداخت. با استفاده از فناوری تبدیل گفتار به نوشتار دیگر لازم نیست تا زمان زیادی را پشت کامپیوتر صرف کنید و مثل مجسمه بنشینید، بلکه کافی است حرف بزنید تا نرم افزار آن را برای شما بنویسد.

در طی چند سال گذشته به لطف پیشرفت هایی که در زمینه یادگیری عمیق و هوش مصنوعی به وجود آمده است، دقت فناوری های تبدیل گفتار به متن چند برابر شده است. شما می توانید با خیال راحت از آن ها برای کارهایتان استفاده کنید.

speech-to-text-windows

لازم به ذکر است که شرکت عامر اندیش هوشمند نیز یکی از اولین شرکت های داخلی است که اقدام به تولید و بومی سازی موتوری برای تبدیل گفتار به نوشتار برای زبان فارسی نموده است و این نرم افزار از دیتا ست بسیار قوی و جامعی برخوردار می باشد. این نرم افزار که فارس آوا نام دارد قادر است با درصد خطای بسیار کمی آنچه می شنود را به متن تبدیل کرده و نیازهای شما را برطرف کند.

 

source : https://amerandish.com

اطلاعات کاربری
  • فراموشی رمز عبور؟
  • آرشیو
    آمار سایت
  • کل مطالب : 31
  • کل نظرات : 0
  • افراد آنلاین : 1
  • تعداد اعضا : 0
  • آی پی امروز : 0
  • آی پی دیروز : 11
  • بازدید امروز : 2
  • باردید دیروز : 17
  • گوگل امروز : 0
  • گوگل دیروز : 0
  • بازدید هفته : 2
  • بازدید ماه : 184
  • بازدید سال : 869
  • بازدید کلی : 3,783