Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie.

поддержка форума (финансовая)

Тема в разделе "О Конференции", создана пользователем Evgenij Koronin, 7 дек 2012.

  1. maxvol

    maxvol Завсегдатай

    круто, мерси )
     
  2. relgames

    relgames Аксакал

    еще следует вспомнить RU.PUNK.ROCK
    ну и, конечно, RU.SEX.TEXT и боброудава
     
  3. storyteller

    storyteller Активный форумчанин

    Я бы, честно говоря, сделал из этого хорошую базу знаний:
    1. установил хабраподобный движок типа livestreet, сконвертировал бы весь контент рассвета

    2. прогнал дамп базы через NER для того, чтобы вытащить информацию о персонах, городах/странах, датах, организациях. Добавил извлеченные предыдущего шага в базу как теги к каждому посту.

    3. тот же дамп пустил на topic detection and tracking tools, извлекая все возможные топики обсуждения, а результат бы ушел в базу на "хлебные крошки".

    4. Отправил извлеченную мета-информацию в поисковый механизм как:
    a) индекс персон и огранизаций (шаг 2)
    б) предметный указатель с терминами (шаг 3) - как в конце книги

    На уровне онтологии этот подход позволяет залинковать и другие сайты, на которых обсуждаются те же события или вопросы.
     
  4. Anna

    Anna Аксакал

    А что, NER уже прямо так хорошо работают на русском? Есть примеры?
     
  5. storyteller

    storyteller Активный форумчанин

    Если закинуть NER на обучение выборку из RDF википедии или dmoz, и применять стемминг, то работает на любом языке. Конечно же, после серии из танцев с бубном. Какая ему разница, какие ближайшие соседи.
     
  6. чертёнок

    чертёнок Активный форумчанин

    a как вы статью писать будете, если вы всем росказали в чем суть дела :unsure: ?
     
  7. Anna

    Anna Аксакал

    2 storyteller:

    Если есть NER в свободном доступе, обученная на Вики, тогда да, верю...

    Но пока у меня складывается ощущение, что там больше state-of-the-art, чем гарантированно работающих технологий :)
     
  8. storyteller

    storyteller Активный форумчанин

    Вы очень ошибаетесь. Дайте кусок дампа, я выделю несколько часов и покажу результат. :)
    Кстати, по странам и городам даже NER не нужен, достаточно простого exact match, так как там нет disambigulation. То есть первая часть задачи решается "в лоб" без всякого машинного обучения.

    P.S. NER в свободном доступе, конечно же, нет, но обучать его можно как с помощью газетт, так и на множестве текстов.
     
  9. Anna

    Anna Аксакал

    Нет disambiguation? А Владимир - это город или человек? (Шутка :) )
     
  10. storyteller

    storyteller Активный форумчанин

    Это вообще не проблема, хорошая экспертная система должна принять правильное решение на основе нескольких моделей, специально обученных по различным контекстам. Собственно говоря, на выходе мы имеем отранжированные контексты с ранком от
    широкого к узкому, и точность системы зависит только от правильности принятого решения.

    P.S. Простите за оффтопик, эта тема явно не относится к вопросу поддержки данного форума. :)
     
  11. Anna

    Anna Аксакал

    Да мне гораздо интереснее на эти темы разговаривать :)

    Ваши утверждения - они на личном опыте основаны? Я-то пока что игралась с этими штучками на уровне полупросвещенного любителя, за новостями слежу, но не всегда.
     
  12. relgames

    relgames Аксакал

    Еще было бы неплохо обсудить, сколько получают специалисты по анализу текстов
    Ну там, меньше 63к или больше
    А если опыта больше 5 лет?
     
  13. storyteller

    storyteller Активный форумчанин

    Естественно, это практический опыт 10 c лишним лет разработки приложений в области ИИ и компьютерной лингвистики. То, о чем я здесь написал, не просто работает, а работает очень хорошо и с высокой точностью, а обучаемая модель и контекст могут быть custom-based.
    Если говорить более известными терминами, то это Semantic Web, один из самых горячих топиков последних лет.
     
  14. storyteller

    storyteller Активный форумчанин

    Так я так и не понял, к чему пришла дискуссия по поводу форума? Кто будет осуществлять поддержку и где?
     
  15. relgames

    relgames Аксакал

    Да, интересно:
    1) Что выкачивает по 100Гб в месяц
    2) Какой хостинг выбрали, с каким планом

    Или деньги собрали, и гори оно все синим пламенем? :)
     
  16. Anna

    Anna Аксакал

    Деньги в любом случае компенсировали только небольшую часть расходов, хотя в качестве моральной поддержки это в самом деле очень помогло. Довольно уныло делать что-то, не получая практически никакого фидбэка, особенно когда на твоем балансе вдруг оказывается гораздо больше, чем в теории предполагалось. Я вообще не рассчитывала на какой-то отклик, честно говоря :)

    По поводу переезда - да, все будет, скорее всего на
    www.dutchwebhosting.nl.
     
  17. okser

    okser Старожил

    Вот мне что интересно - хостер может помогать маленьким и экономным клиентам выбирать оговоренный лимит по трафику? Помог, и счёт выставил. Пяток клиентов - рубль.
     
  18. Anna

    Anna Аксакал

    Да всякое возможно, хотя если все душевные силы тратить на разработку теорий заговора, то лучше вообще ничего не начинать :)
     
  19. storyteller

    storyteller Активный форумчанин

    Я, конечно, человек здесь относительно новый, но я бы посоветовал выкатить базу на новом хостинге и на новом домене, и поставить здесь в .htaccess на rassvet.com редиректы на те же страницы на новом сайте. Сильно поможет с трафиком в будущем.
     
  20. devoid

    devoid Админ

    на это есть например google analytics, ну и логи сервера
     

Поделиться этой страницей

Загрузка...