liste pour une application Web Python fonctionne mal

voix
0

Je suis nouveau sur le site, je ne suis pas sûr que ce soit le bon endroit pour poser des questions de python, sinon Alertez-moi et je renvoyez ce au bon endroit. J'ai besoin d'aide avec un code que je travaille pour ma classe Coursera, l'objectif est la suivante: Trouver le lien à la position 18 (1 est le premier nom). Suivez ce lien. Répétez ce processus 7 fois. La réponse est le nom que vous récupérez. Astuce: Le premier caractère du nom de la dernière page que vous chargerez est: J de lien :( http://py4e-data.dr-chuck.net/known_by_Shannon.html )

J'ai écrit un code pour cette tâche, mais il semble que cela ne fonctionnait pour le premier élément, et chaque site depuis que premier, le mauvais fonctionnement de la liste est le code. Mon idée est d'obtenir le code Html et ajouter l'URL dans une liste, puis trouver le 18e élément de la liste, puis rediriger la boucle entière avec la nouvelle URL et supprimer l'ancienne liste. La répétition du processus de 7 fois. Je suis sérieusement confus de savoir si exactement où le code a mal tourné. Merci d'avance.

    import urllib.request, urllib.parse, urllib.error
from bs4 import BeautifulSoup
import ssl
import re
term_counter = (0)
file = list()
regex = list()
# Ignore SSL certificate errors
ctx = ssl.create_default_context()
ctx.check_hostname = False
ctx.verify_mode = ssl.CERT_NONE

url = input('Enter - ')
for I in range(7) :
    html = urllib.request.urlopen(url, context=ctx).read()
    soup = BeautifulSoup(html, 'html.parser')
    tags = soup('a')
    del file[:]
    file = list()
    for tag in tags :
        file.append(tag)
        print(tag.contents[0])
        url = tag.get('href')
        print (url)
    for items in range(17,18) :
        print(file[items])
Créé 02/09/2018 à 05:22
source utilisateur
Dans d'autres langues...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more