Аналітика тексту за допомогою Python
Моментальне завантаження
після оплати (24/7)
Широкий вибір форматів
(для всіх пристроїв)
Повна версія книги
(в т.ч. для Apple та Android)
Дані — це нова нафта, а неструктуровані дані — особливо текст, зображення та відео — містять велику кількість інформації. Однак через природну складність обробки та аналізу цих даних люди часто утримуються від витрачання додаткового часу та зусиль на використання структурованих наборів даних для аналізу цих неструктурованих джерел даних, які можуть бути потенційною золотою жилою. Обробка природної мови (NLP) — це використання інструментів, методів і алгоритмів для обробки та розуміння даних на основі природної мови, які зазвичай неструктуровані, як текст, мова тощо. У цій книзі ми розглянемо випробувані стратегії — техніки та робочі процеси, — які можуть використовувати практики та спеціалісти з обробки даних, щоб отримати корисну інформацію з текстових даних. Спеціалізація в таких областях, як комп’ютерне бачення та обробка природної мови, більше не є розкіш, але необхідність, яку очікують від будь-якого дослідника даних у сучасному швидкоплинному світі! Текстова аналітика з Python — це практичний посібник із вивчення та застосування методів НЛП для отримання корисних ідей із зашумлених і неструктурованих текстових даних. Ця книга допоможе своїм читачам зрозуміти основні концепції НЛП разом із розширеними тематичними дослідженнями та практичними прикладами для опанування стану -сучасні інструменти, техніки та фреймворки для реального застосування НЛП для вирішення проблем реального світу. Ми використовуємо Python 3 і найновіші та найкращі сучасні фреймворки, зокрема NLTK, Gensim, spaCy, Scikit-Learn, TextBlob, Keras і TensorFlow, щоб продемонструвати приклади в книзі. Ви можете знайти всі приклади використовується в книзі на GitHub за адресою У моїй моїй подорожі в цій галузі поки що я боровся з різними проблемами, зіткнувся з багатьма труднощами та з часом засвоїв різні уроки . Ця книга містить велику частину знань, які я здобув у світі текстової аналітики та обробки природної мови, де побудувати химерну хмару слів із купи текстових документів уже недостатньо. Можливо, найбільшою проблемою щодо вивчення текстової аналітики є не брак інформації, а забагато інформації, що часто називають інформаційним перевантаженням. Є так багато ресурсів, документації, статей, книг і журналів, які містять так багато вмісту, що вони часто переповнюють когось нового до поля. Можливо, у вас виникали такі запитання, як «Яка правильна техніка вирішення проблеми?», «Як насправді працює резюмування тексту?», «Які фреймворки найкраще підходять для вирішення багатокласової категоризації тексту?», серед багатьох інших! Поєднуючи математичні та теоретичні концепції з практичними реалізаціями практичних прикладів з використанням Python, ця книга намагається вирішити цю проблему та допомогти читачам уникнути нагальних проблем, з якими я зіткнувся на моїй подорожі досі. Ця книга дотримується комплексного та структурованого підходу . Спочатку в початкових розділах розглядаються основи розуміння природної мови та Python для обробки текстових даних. Коли ви ознайомитеся з основами, ми поговоримо про обробку, синтаксичний аналіз і розуміння тексту. Потім ми розглядаємо цікаві проблеми текстової аналітики в кожному з наступних розділів, включаючи класифікацію тексту, кластеризацію та аналіз схожості, підсумовування тексту та тематичні моделі, семантичний аналіз і розпізнавання іменованих об’єктів, а також аналіз настроїв та інтерпретацію моделі. Останній розділ — це цікавий розділ про нещодавні досягнення НЛП завдяки глибокому навчанню та трансферному навчанню, і ми розглядаємо приклад класифікації тексту з універсальними вбудованими реченнями. Ідея цієї книги полягає в тому, щоб дати вам смак величезного ландшафту текстової аналітики та НЛП, а також озброїти вас необхідними інструментами, техніками та знаннями для вирішення власних проблем. Сподіваюся, ця книга буде для вас корисною та бажаю вам успіхів у вашій подорожі світом текстової аналітики та НЛП!
FL/277027/R
Характеристики
- Мова
- Англійська