Windows-дегі файлды Solr-ге қалай жүктеуге болады?

Мен Windows Server 2003 жүйесінде мәтінді шығарудың менің Solr орнатылымында жұмыс істеп жатқанын тексеруім керек. Файлдарды Solr-ге жүктеп салу үшін табылған барлық мысалдар төмендегідей бұралуды қолдануға арналған.

curl "http://localhost:8983/solr/update/extract?&extractOnly=true"  --data-binary @tutorial.html  -H 'Content-type:text/html'

Мұны Windows жүйесінде қалай жасауға болады? Мен pdf және Word құжатын жүктеуді тексеруді қалаймын, содан кейін Solr admin беті арқылы құжатта қамтылған сөздерді іздейтінімді растаймын.

12

9 жауаптар

Мысалдармен post.jar ( apache-solr-X.X.X.zip example \ exampledocs қалтасын қараңыз) келіп түседі:

java -jar post.jar -h

This is a simple command line tool fНЕМЕСЕ POSTing raw data to a Solr
pНЕМЕСЕt.  Data can be read from files specified as commandline args,
as raw commandline arg strings, НЕМЕСЕ via STDIN.
Examples:
  java -jar post.jar *.xml
  java -Ddata=args  -jar post.jar '42'
  java -Ddata=stdin -jar post.jar < hd.xml
  java -Durl=http://localhost:8983/solr/update/csv -Dtype=text/csv -jar post.jar *.csv
  java -Durl=http://localhost:8983/solr/update/json -Dtype=application/json -jar post.jar *.json
  java -Durl=http://localhost:8983/solr/update/extract?literal.id=a -Dtype=application/pdf -jar post.jar a.pdf
Other options controlled by System Properties include the Solr
URL to POST to, the Content-Type of the data, whether a commit
НЕМЕСЕ optimize should be executed, and whether the response should
be written to STDOUT. These are the defaults fНЕМЕСЕ all System Properties:
  -Ddata=files
  -Dtype=application/xml
  -Durl=http://localhost:8983/solr/update
  -Dcommit=yes
  -Doptimize=no
  -Dout=no

НЕМЕСЕ

The Windows PowerShell 3.0 has an Invoke-WebRequest command which fНЕМЕСЕ sure could be used fНЕМЕСЕ that. See this blog post.

Invoke-WebRequest

18
қосылды
егер v1.3 пайдаланылса, -h жұмыс істемейді. көмекші болады.
қосылды автор Scott Chu, көзі
Post.jar арқылы pdf форматындағы файлды жіберуге тырыстым, бірақ қателесем. SimplePostTool: FATAL: Solr қайтарылған қателік # 405 әдісі рұқсат етілмеген.
қосылды автор John81, көзі
Менде Томачаттың астында жұмыс істейтін Solr бар, егер бұл өзгеріс жасаса. Мен жұмыс істеп жатқан команда мына жерде: java -Durl = localhost: 8080/solr /update/extract?literal.id=addin -Dtype = application/pdf -jar post.jar addin.pdf
қосылды автор John81, көзі
Solr Tomcat астында дұрыс іске қосылады. Жүктеп салу әрекеті үшін қате алу.
қосылды автор John81, көзі
НАЗАР АУДАРЫҢЫЗ: @Deprecated SolrUpdateServlet сұрау параметрлерін қабылдамайды: literal.id = a Егер сіз solrj қолдансаңыз, сұраныс өңдеушісін тіркеуге/жаңартуға емес, содан кейін осы сервлетті пайдалануға міндетті екенін тексеріңіз. Add: to your solrconfig.xml 28.10.2011 14:32:23 org.apache.solr.common.SolrException log DEVERE: «legacy» update командасы: com.ctc.wstx.exc.WstxIOException: жарамсыз UTF-8 орта байт 0xe3 (char # 10, байт -1 -1)
қосылды автор John81, көзі
Бұл Drupal-те іздеу үшін Solr-ды қолданғаннан бері менің түпнұсқа solrconfig.xml-ді Drupal-мен көшірген кезде, бұл мәселенің бір бөлігі деп ойлаймын. RequestHandler кілтіне қосып, Tomcat-ді қайтадан бастадым, бірақ әлі де сәттілікке қол жеткізе алмадым.
қосылды автор John81, көзі
Иә ол сондай. Көмектесуге рақмет!
қосылды автор John81, көзі
@John: сіз қолданған пәрменді жібере аласыз ба?
қосылды автор jeha, көзі
@John: Мен стандартты мысалды қолданып көрдім: серверді apache-solr-3.4.0 \ example> java -jar start.jar бойынша іске қосып, pdf файлын apache-solr -3.4.0 \ example \ exampledocs> java -Durl = http://localhost: 8983/solr/update/extract? Literal.id = f & zwnj; oobar -Dtype = application/pdf -jar post.jar foobar.pdf мен үшін жұмыс істейді ...
қосылды автор jeha, көзі
@John: Қателер үшін Tomcat журналдарын қараңыз - кейбіреулеріңіз сенімді болады. Solr веб-бағдарламасы дұрыс конфигурацияланбаған. Томатты іске қосу кезінде JAVA_OPTS = -Dsolr.solr.home = «... \ apache-solr-3.4.0 \ example \ so & zwnj; lr» дұрыс каталогты көрсетеді
қосылды автор jeha, көзі
@John: Мен пайдаланатын конфигурацияда бар (бұл 3.4.0 мысалдармен бірге жеткізілген әдепкі теңшелім)
қосылды автор jeha, көзі
@John: Бірақ сіздің бастапқы сұрағыңызға жауап, дұрыс? Мүмкін сіз конфигурация мәселесіне қатысты жаңа сұрақ қоюыңыз мүмкін бе?
қосылды автор jeha, көзі
Бұл әрекетті орындау үшін PowerShell командлетін Invoke-WebRequest (шын мәнінде curl деген атпен бүркенген) пайдалануды сәтті аяқтаған кез келген адам мүмкін бе? Мен 400 қате аламын (Bad Request). Пут немесе Post әдісін жасау керек пе? Деректер -InFile ретінде беріле ме немесе бұл үшін -Body керек пе?
қосылды автор Jay Carlton, көзі
Файлға жолдың орнына -Method Post және -Body $ string_from_file сияқты келеді. Бұл кемшіліктер мені кешірді.
қосылды автор Jay Carlton, көзі

Windows-дегі Solr 6.1-ні пайдалану Мен solr-core-x.y.z.jar-дан SimplePostTool-ді пайдалана отырып, қалтаны рекурсивті индекстеп алдым:

java -classpath C:\Solr\solr-6.1.0\dist\solr-core-6.1.0.jar -Dauto=yes -Dc=yourcorename -Ddata=files -Drecursive=yes org.apache.solr.util.SimplePostTool C:\Solr\solr-6.1.0\docs

Solr қалтасымен «C: \ Solr \ solr-6.1.0 \» дегенді ауыстыру керек, solr-core-6.1.0.jar үшін дұрыс нұсқа нөмірін көрсетіңіз, қалтаны қалаған файлдың орнына орнатыңыз Индекс және өзектің өзінде бар болуын қамтамасыз ету.

2
қосылды

5.0 нұсқасымен құжаттарды жаңарту кезінде өзіңіздің атыңызды атап өтуіңіз керек. Мысалға, мысалдардың мысалдарын мысалға келтіріңіз:

java -Dc = «core_name» -jar post.jar * .xml

мұнда core_name ядроның атымен ауыстырылады

2
қосылды

Келесі опциялар болуы мүмкін -

  • Fire URL from browser using the stream.file (stream.url for remote urls) parameter which points to the file on the local file system e.g. sample_url
  • Install cgywin/curl for windows, which will help you to fire these urls.
  • Write a short program using Solrj (or any other solr client) to post these documents.
1
қосылды
Кішкене қосымша: CURL терезе үшін қол жетімді. Сондай-ақ libCURL бар, онда CURL операцияларын ондаған негізгі тілдерде енгізуге болады.
қосылды автор aitchnyu, көзі

Егер сіз cURL пәрменін solr файлына орналастыру үшін пайдаланғыңыз келсе, осы қызметтік бағдарламаны cURL Home </< a>. CURL.exe жолын терезелердің қоршаған ортаны айнымалысы жолында қамтамасыз етіңіз және содан кейін сіз пәрменді пайдалана аласыз Сіз сұраған

curl "http://localhost:8983/solr/update/extract?&extractOnly=true" --data-binary @"location of file/test.pdf" -H 'Content-type:application/pdf'

яғни мазмұн түрін өзгертуіңіз қажет.

Солрға каталогты орналастырудың тағы бір тәсілі - бұл «post.jar» утилитасын Solr мысалдар каталогында қолдану - есте сақтаңыз, бұл қызметтік бағдарлама өндіріс үшін пайдаланылмайды.

Мұнда үлгі командасы.

   java -Ddata=files -Dtype=html -Dfiletypes=htm,html -Dauto=yes -Drecursive=yes -jar post.jar "Drive_letter:\yourpath\."

Жоғарыда Solr 4.0-мен жақсы жұмыс істейді

1
қосылды

Сіз Firefox Poster Plugin-ды қолданып көре аласыз. Мен бірнеше жүктеуді қолданамын және олар жақсы жұмыс істеді :)

1
қосылды

Сіз мұны істей аласыз:

C:\Java\Libs\apache-solr-4.0.0-BETA\example>"C:\Program Files (x86)\Internet Explorer\iexplore.exe" "http://localhost:8983/solr/collection1/update?commit=true&stream.contentType=text/csv;charset=utf-8 &stream.file=C:/Java/Libs/apache-solr-4.0.0-BETA/example/exampledocs/listado_talleres_new.csv"

1
қосылды
Жүйе туралы дұрыс емес болжамдар жасайсың. Жауабыңызды жалпыға ортақ болуы үшін редакциялай аласыз ба? - Сондай-ақ, сіз жауапты қалай жасайтыныңызды көрсетпесеңіз, кем дегенде қысқаша түсіндірме қосасыз ба?
қосылды автор Alexander Kosubek, көзі

Windows үшін мен мына әрекеттерді қолдана аламын:

java -classpath %sOLR_HOME%\dist\solr-core-6.5.1.jar -Dauto=yes -Dc=books -Ddata=files -Drecursive=yes org.apache.solr.util.SimplePostTool c:\apache-solr-6.5.1\server\solr\books\data\index\*.*
0
қосылды

Мұны Powershell көмегімен орындау үшін төмендегі пәрменді іске қосыңыз:

$header =  @{"Content-type"="text/plain"; "charset"="utf-8"};

Invoke-WebRequest -Uri http://localhost:8983/solr/YOUR_CORE_NAME/update/csv -Headers $header -InFile "C:\data.csv" -Method Post
0
қосылды