Cliquez sur

La base de l'analyseur nakolesah.ru

Грабим nakolesah.ru

Un exemple du site analyseur nakolesah.ru

Ugh, visser le nakolesah analyseur imputé à l'état et de saisir la sélection des pneus sur la voiture. Qui se soucie - une référence au script à la fin de l'après.

Quelque chose en lui faudra changer, pas vraiment J'aime la logique du travail actuel, basé sur les GET-demande (si le navigateur reçoit toutes les informations se référant à la asp-script pour le transfert de différents paramètres dans le POST-demande). Je POST seulement à la fin, et nous devons essayer de reproduire le travail du navigateur, mais le temps n'était pas particulièrement à comprendre.

Ce n'est pas comme une béquille comme une fonction de substitution, les noms de modèles de voitures. Lors de l'analyse nkolesah confrontés au problème (s'applique uniquement aux demandes GET-) grandes marques différentes et des modifications à la voiture des listes déroulantes et l'adresse de la page, tels que:

 TransformModel sous ($ $) {my ($ marque, $ car_model) = @ _; car_model $ = ~ s / - / / g, si la marque $ ~ / Saab | Jaguar | Nissan | Honda | Citroen | MG | Mercedes | Mazda! ! | Ford / i; car_model $ = ~ s / [- +] / _ / g, si la marque ~ $ / Citroën / i; if ($ marque = ~ / Nissan / i) {$ = ~ car_model s/Z/350z / i; car_model $ = ~ s / GT_R / GTR / i;} $ car_model = 'navigaror_1' si $ marque = ~ m # # i et Lincoln $ car_model 'Navigator' éq; $ car_model = '%% Du 81ato D1 » si $ marque = ~ m # # i et Fiat car_model $ = ~ / dusato / i; if ($ marque = ~ / Chery / i) {$ car_model = 'c_eastar' si $ car_model eq 'CrossEastar'; car_model $ = $ de la marque. '_'.  $ Car_model si car_model $ = ~ / kimo | qq \ d / I;?} Return $ car_model;} 

Plein de déchargement dure environ 12 heures dans un mode séquentiel (fonctionne dans un ruisseau, le client n'a pas besoin de multi-threading, mais je n'avais pas le temps de le joindre pour le plaisir). Si quelqu'un décide de faire le téléchargement et l'analyse - par exemple, il est conseillé de faire quatre copies du script et de briser la gamme de marques de voitures en quatre groupes, respectivement (tous dans la base de données nakolesah 61 marque pour le moment). Vous pouvez utiliser la décomposition prêt, qui est le code que j'ai fait:

  # Next if $ marque ~ / Rover |! FAW | Volkswagen | Ferrari | Jaguar | Smart | Suzuki | gaz | Bentley |
 Peugeot | Pontiac | Honda | Maybach | vaz | Infiniti | Buick | Subaru / i;
 # Next if $ marque ~ / Lancia |! Opel | Daihatsu | Hummer | Kia | Fiat | Nissan | Saturn |
 Mini | Hyundai | Renault | Citroen | Lincoln | Chevrolet | Dodge / i;
 # Next if $ marque ~ / Chery |! Mazda | Ford | UAZ | Acura | Porsche | Lotus | Volvo | Toyota |
 Skoda | Cadillac | Scion | Saab | Mercury | Daewoo / i;
 # Next if $ marque ~ / Chrysler |! BMW | Isuzu | MG | Mercedes | GMC | Seat | Maserati |
 Mitsubishi | Jeep | Lexus | Audi | Lifan | Geely / i; 

Dans chacune des quatre copies de décommenter la gamme appropriée, les fichiers sont mieux décrits de différentes manières, car par défaut la sortie passe à un fichier nommé imya_skripta.xml (même si vous pouvez, si la clé zpuske sur le transfert du fichier de sortie).

Sur le chemin, ne skriptik pour valider les résultats de l'analyseur nakolesah.ru, une fois de plus la beauté heureux de l'orge regulyarok:

  m | <(\ w +) \ s \ w * =? "\ w *?"?> \ s * </ \ 1> $ | ig 

une ligne de balises chèques sur l'occupation (si tout le téléchargement), comprend des balises avec des attributs et sans. Validator résultats nakolesah.ru déchargement peut être téléchargé avec le parseur.

Pour le plaisir, quelques statistiques peu sociaux (peut-être lorsque la traction ponostalgirovat :) ):

  • base de données en XML net (pas de lignes vides):

      $ Wc-l nakolesah.ru_full_base_4.12.2009.xml
     550657 nakolesah.ru_full_base_4.12.2009.xml 

  • 577 modèles de voitures

Comme promis, un lien vers le site de téléchargement de grabber, analyseur nakolesah.ru (sortie validateur, aussi, est dans l'archive): + nakolesah.ru_parser Validator

Bonne chance!

Plus d'informations sur des sujets similaires:

Catégorie Filed under: Internet , Codage | Balise Tags: , , , , | Les Commentaires 18 commentaires

Commentaires

18 commentaires à "analyseur de base nakolesah.ru"

  1. sberkut écrit:

    Bonne journée! Apparemment, ils ont changé la conception et la taille sont analysées, vous ne pouvez pas corriger cette taxe / gratuit! Merci)

    • dimio écrit:

      Taille quoi s'agit-il? Prenons une action concrète immédiatement, de sorte qu'il sera plus facile à comprendre ce qui se passait.

      • sberkut écrit:

        le script prend quelques modèles de voitures de grandes, mais les tailles de roues et des pneus adaptés, il choisit, en tant que résultat de l'attribut xml a la forme:

        ....

        • dimio écrit:

          Je ne peux pas dire ce que c'était, depuis que je suis bien acquitté de toutes les informations.

          • sberkut écrit:

            J'ai une redirection ne passe pas la boue, il écrit:

            Utilisation de la valeur non initialisée redir_url $ en concaténation (.) Ou une chaîne dans / home / digbox / data / www / digbox.ru / cgi-bin / nakolesah_ru_parser.pl la ligne 152.

            pas aider à comprendre? :)

            • dimio écrit:

              Immédiatement, lorsque vous commencez à ne pas passer? Ajouter au 152 de ligne de comme suit:

              Une
              2
              print $ response-> contenu, "\ n";
              sortie;

              et permettez-moi de connaître le résultat.

              • sberkut écrit:

                donne le texte suivant:

                1 | # | | 4 | 54 | pageRedirect | |%%% 2fselect 2ftiresbyauto 2facura%%% 2f2003 2fcl 2f32i.aspx |

                J'ai réalisé pour l'URL de redirection identifie, mais ne passe pas : (

                • dimio écrit:

                  Eh bien, il n'est pas difficile à corriger. Il n'a tout simplement pas reconnaître un lien vers une redirection, parce que la forme a changé sa délivrance.
                  Il devrait être dans la ligne 150 remplacer le modèle de recherche:

                  Une
                  my $ redir_url = 1 $ si $ response-> content = ~ m # / ([\ WA-nk-I \ \ s \ (\),% -.] +) \ | $ # i;

                  sur

                  Une
                  my $ redir_url = 1 $ si $ response-> content = ~ m # \ | \ | ([\ WA-nk-I \ \ s \ (\),% -.] +) \ | $ # i;
                  • sberkut écrit:

                    Merci beaucoup cela a fonctionné)

                  • sberkut écrit:

                    et pas pressé (ne voulait pas sortir, conserve la même (

                    • dimio écrit:

                      Très probablement, il a changé non seulement la forme de l'émission de liens, mais également des informations donnant sur pneus ou des disques pour récupérer et avoir beaucoup de changement dans la fonction de l'analyse de la page.

  2. Cry a écrit:

    Analyseur ajusté peut partager, ou une base, ou d'écrire pour eux ... par skype:

    Une
    cry.int
  3. Vipertp écrit:

    Si quelqu'un pouvait fixer l'analyseur. Aide pzhl.
    icq: 308037667
    skype: viperstp

  4. Rock'n'roll écrit:

    Quelqu'un peut-il toujours partager des informations pourquoi ne pas sortir les tailles, ce que le code doit être modifié.

    • dimio écrit:

      Au-dessus des personnes ont donné leur contact et a écrit que tout se redressa en vertu du présent-journée. conditions de.

  5. Alexander écrit:

    Bonjour, si quelqu'un a un analyseur syntaxique pour php alors s'il vous plaît n'hésitez pas à partager, puis ont immédiatement (((mon Asya 202716 et ensuite nous Dle moteur (il nxn)

Laisser un commentaire