Javascript: REGEX um alle relativen Urls in absolute zu ändern

Question

Javascript: REGEX um alle relativen Urls in absolute zu ändern

Gefragt el 25 de September, 2011: Wann wurde die Frage gestellt
20032 Ansichten: Anzahl der Besuche der Frage
5 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Ich erstelle gerade einen Node.js Webscraper/Proxy, aber ich habe Probleme beim Parsen von relativen Urls, die im Skripting-Teil des Quelltextes zu finden sind. Ich dachte mir, dass REGEX den Trick machen würde. Obwohl es unbekannt ist, wie ich dies erreichen würde.

Gibt es irgendeine Möglichkeit, wie ich das machen kann?

Ich bin auch offen für eine einfachere Methode, da ich nicht weiß, wie andere Proxys Websites analysieren. Ich dachte, dass die meisten sind nur glorifizierte Website Scraper, die eine Website-Quelle ein Relais alle Links/Formulare zurück zu den Proxy lesen kann.

Gefragt el 25 de September, 2011 von Trevor

Answer 1

5 Antworten

Answer 2

44voto

Rob W Punkte 327048

Erweiterte Funktionen zur Ersetzung von HTML-Zeichenfolgen

_Hinweis für OP, weil er eine solche Funktion gewünscht hat: ändern. base_url zur Basis-URL Ihres Proxys hinzufügen, um die gewünschten Ergebnisse zu erzielen._

Im Folgenden werden zwei Funktionen gezeigt (die Anleitung zur Verwendung ist im Code enthalten). Achten Sie darauf, dass Sie keinen Teil der Erklärung dieser Antwort auslassen, um das Verhalten der Funktion vollständig zu verstehen.

rel_to_abs(urL) - Diese Funktion gibt absolute URLs zurück. Wenn eine absolute URL mit einem allgemein vertrauenswürdigen Protokoll übergeben wird, gibt sie diese URL sofort zurück. Andernfalls wird eine absolute URL aus der base_url und das Funktionsargument. Relative URLs werden korrekt geparst ( ../ ; ./ ; . ; // ).
replace_all_rel_by_abs - Diese Funktion parst alle Vorkommen von URLs, die in HTML eine wichtige Bedeutung haben, wie CSS url() , Links und externe Ressourcen. Im Code finden Sie eine vollständige Liste der geparsten Instanzen. Siehe diese Antwort für eine angepasste Umsetzung zu HTML-Zeichenfolgen bereinigen aus einer externen Quelle (zum Einbetten in das Dokument).
Testfall (am Ende der Antwort): Um die Wirksamkeit der Funktion zu testen, fügen Sie das Bookmarklet einfach in die Leiste des Standorts ein.

rel_to_abs - Parsing relativer URLs

function rel_to_abs(url){
    /* Only accept commonly trusted protocols:
     * Only data-image URLs are accepted, Exotic flavours (escaped slash,
     * html-entitied characters) are not supported to keep the function fast */
  if(/^(https?|file|ftps?|mailto|javascript|data:image\/[^;]{2,9};):/i.test(url))
         return url; //Url is already absolute

    var base_url = location.href.match(/^(.+)\/?(?:#.+)?$/)[0]+"/";
    if(url.substring(0,2) == "//")
        return location.protocol + url;
    else if(url.charAt(0) == "/")
        return location.protocol + "//" + location.host + url;
    else if(url.substring(0,2) == "./")
        url = "." + url;
    else if(/^\s*$/.test(url))
        return ""; //Empty = Return nothing
    else url = "../" + url;

    url = base_url + url;
    var i=0
    while(/\/\.\.\//.test(url = url.replace(/[^\/]+\/+\.\.\//g,"")));

    /* Escape certain characters to prevent XSS */
    url = url.replace(/\.$/,"").replace(/\/\./g,"").replace(/"/g,"%22")
            .replace(/'/g,"%27").replace(/</g,"%3C").replace(/>/g,"%3E");
    return url;
}

Fälle / Beispiele:

http://foo.bar . Bereits eine absolute URL, daher sofort zurückgegeben.
/doo Relativ zur Wurzel: Gibt die aktuelle Root + die angegebene relative URL zurück.
./meh Bezogen auf das aktuelle Verzeichnis.
../booh Relativ zum übergeordneten Verzeichnis.

Die Funktion konvertiert relative Pfade in ../ und führt eine Suchen-und-Ersetzen-Funktion ( http://domain/sub/anything-but-a-slash/../me a http://domain/sub/me ).

replace_all_rel_by_abs - Konvertieren Sie alle relevanten Vorkommen von URLs
URLs innerhalb von Skriptinstanzen ( <script> Die Ereignisbehandler sind no ersetzt, da es nahezu unmöglich ist, einen schnellen und sicheren Filter zum Parsen von JavaScript zu erstellen.

Dieses Skript ist mit einigen Kommentaren versehen. Reguläre Ausdrücke werden dynamisch erstellt, da ein einzelner RE eine Größe von 3000 Zeichen. <meta http-equiv=refresh content=.. > kann auf verschiedene Weise verschleiert werden, daher die Größe der RE.

function replace_all_rel_by_abs(html){
    /*HTML/XML Attribute may not be prefixed by these characters (common 
       attribute chars.  This list is not complete, but will be sufficient
       for this function (see http://www.w3.org/TR/REC-xml/#NT-NameChar). */
    var att = "[^-a-z0-9:._]";

    var entityEnd = "(?:;|(?!\\d))";
    var ents = {" ":"(?:\\s|&nbsp;?|&#0*32"+entityEnd+"|&#x0*20"+entityEnd+")",
                "(":"(?:\\(|&#0*40"+entityEnd+"|&#x0*28"+entityEnd+")",
                ")":"(?:\\)|&#0*41"+entityEnd+"|&#x0*29"+entityEnd+")",
                ".":"(?:\\.|&#0*46"+entityEnd+"|&#x0*2e"+entityEnd+")"};
                /* Placeholders to filter obfuscations */
    var charMap = {};
    var s = ents[" "]+"*"; //Short-hand for common use
    var any = "(?:[^>\"']*(?:\"[^\"]*\"|'[^']*'))*?[^>]*";
    /* ^ Important: Must be pre- and postfixed by < and >.
     *   This RE should match anything within a tag!  */

    /*
      @name ae
      @description  Converts a given string in a sequence of the original
                      input and the HTML entity
      @param String string  String to convert
      */
    function ae(string){
        var all_chars_lowercase = string.toLowerCase();
        if(ents[string]) return ents[string];
        var all_chars_uppercase = string.toUpperCase();
        var RE_res = "";
        for(var i=0; i<string.length; i++){
            var char_lowercase = all_chars_lowercase.charAt(i);
            if(charMap[char_lowercase]){
                RE_res += charMap[char_lowercase];
                continue;
            }
            var char_uppercase = all_chars_uppercase.charAt(i);
            var RE_sub = [char_lowercase];
            RE_sub.push("&#0*" + char_lowercase.charCodeAt(0) + entityEnd);
            RE_sub.push("&#x0*" + char_lowercase.charCodeAt(0).toString(16) + entityEnd);
            if(char_lowercase != char_uppercase){
                /* Note: RE ignorecase flag has already been activated */
                RE_sub.push("&#0*" + char_uppercase.charCodeAt(0) + entityEnd);   
                RE_sub.push("&#x0*" + char_uppercase.charCodeAt(0).toString(16) + entityEnd);
            }
            RE_sub = "(?:" + RE_sub.join("|") + ")";
            RE_res += (charMap[char_lowercase] = RE_sub);
        }
        return(ents[string] = RE_res);
    }

    /*
      @name by
      @description  2nd argument for replace().
      */
    function by(match, group1, group2, group3){
        /* Note that this function can also be used to remove links:
         * return group1 + "javascript://" + group3; */
        return group1 + rel_to_abs(group2) + group3;
    }
    /*
      @name by2
      @description  2nd argument for replace(). Parses relevant HTML entities
      */
    var slashRE = new RegExp(ae("/"), 'g');
    var dotRE = new RegExp(ae("."), 'g');
    function by2(match, group1, group2, group3){
        /*Note that this function can also be used to remove links:
         * return group1 + "javascript://" + group3; */
        group2 = group2.replace(slashRE, "/").replace(dotRE, ".");
        return group1 + rel_to_abs(group2) + group3;
    }
    /*
      @name cr
      @description            Selects a HTML element and performs a
                                search-and-replace on attributes
      @param String selector  HTML substring to match
      @param String attribute RegExp-escaped; HTML element attribute to match
      @param String marker    Optional RegExp-escaped; marks the prefix
      @param String delimiter Optional RegExp escaped; non-quote delimiters
      @param String end       Optional RegExp-escaped; forces the match to end
                              before an occurence of <end>
     */
    function cr(selector, attribute, marker, delimiter, end){
        if(typeof selector == "string") selector = new RegExp(selector, "gi");
        attribute = att + attribute;
        marker = typeof marker == "string" ? marker : "\\s*=\\s*";
        delimiter = typeof delimiter == "string" ? delimiter : "";
        end = typeof end == "string" ? "?)("+end : ")(";
        var re1 = new RegExp('('+attribute+marker+'")([^"'+delimiter+']+'+end+')', 'gi');
        var re2 = new RegExp("("+attribute+marker+"')([^'"+delimiter+"]+"+end+")", 'gi');
        var re3 = new RegExp('('+attribute+marker+')([^"\'][^\\s>'+delimiter+']*'+end+')', 'gi');
        html = html.replace(selector, function(match){
            return match.replace(re1, by).replace(re2, by).replace(re3, by);
        });
    }
    /* 
      @name cri
      @description            Selects an attribute of a HTML element, and
                                performs a search-and-replace on certain values
      @param String selector  HTML element to match
      @param String attribute RegExp-escaped; HTML element attribute to match
      @param String front     RegExp-escaped; attribute value, prefix to match
      @param String flags     Optional RegExp flags, default "gi"
      @param String delimiter Optional RegExp-escaped; non-quote delimiters
      @param String end       Optional RegExp-escaped; forces the match to end
                                before an occurence of <end>
     */
    function cri(selector, attribute, front, flags, delimiter, end){
        if(typeof selector == "string") selector = new RegExp(selector, "gi");
        attribute = att + attribute;
        flags = typeof flags == "string" ? flags : "gi";
        var re1 = new RegExp('('+attribute+'\\s*=\\s*")([^"]*)', 'gi');
        var re2 = new RegExp("("+attribute+"\\s*=\\s*')([^']+)", 'gi');
        var at1 = new RegExp('('+front+')([^"]+)(")', flags);
        var at2 = new RegExp("("+front+")([^']+)(')", flags);
        if(typeof delimiter == "string"){
            end = typeof end == "string" ? end : "";
            var at3 = new RegExp("("+front+")([^\"'][^"+delimiter+"]*" + (end?"?)("+end+")":")()"), flags);
            var handleAttr = function(match, g1, g2){return g1+g2.replace(at1, by2).replace(at2, by2).replace(at3, by2)};
        } else {
            var handleAttr = function(match, g1, g2){return g1+g2.replace(at1, by2).replace(at2, by2)};
    }
        html = html.replace(selector, function(match){
             return match.replace(re1, handleAttr).replace(re2, handleAttr);
        });
    }

    /* <meta http-equiv=refresh content="  ; url= " > */
    cri("<meta"+any+att+"http-equiv\\s*=\\s*(?:\""+ae("refresh")+"\""+any+">|'"+ae("refresh")+"'"+any+">|"+ae("refresh")+"(?:"+ae(" ")+any+">|>))", "content", ae("url")+s+ae("=")+s, "i");

    cr("<"+any+att+"href\\s*="+any+">", "href"); /* Linked elements */
    cr("<"+any+att+"src\\s*="+any+">", "src"); /* Embedded elements */

    cr("<object"+any+att+"data\\s*="+any+">", "data"); /* <object data= > */
    cr("<applet"+any+att+"codebase\\s*="+any+">", "codebase"); /* <applet codebase= > */

    /* <param name=movie value= >*/
    cr("<param"+any+att+"name\\s*=\\s*(?:\""+ae("movie")+"\""+any+">|'"+ae("movie")+"'"+any+">|"+ae("movie")+"(?:"+ae(" ")+any+">|>))", "value");

    cr(/<style[^>]*>(?:[^"']*(?:"[^"]*"|'[^']*'))*?[^'"]*(?:<\/style|$)/gi, "url", "\\s*\\(\\s*", "", "\\s*\\)"); /* <style> */
    cri("<"+any+att+"style\\s*="+any+">", "style", ae("url")+s+ae("(")+s, 0, s+ae(")"), ae(")")); /*< style=" url(...) " > */
    return html;
}

Eine kurze Zusammenfassung der privaten Funktionen:

rel_to_abs(url) - Konvertiert relative / unbekannte URLs in absolute URLs
replace_all_rel_by_abs(html) - Ersetzt alle relevanten Vorkommen von URLs innerhalb einer HTML-Zeichenkette durch absolute URLs.
1. ae - A ny E ntity - Gibt ein RE-Muster für HTML-Entities zurück.
2. by - ersetzen von - Diese kurze Funktion fordert die eigentliche URL-Ersetzung ( rel_to_abs ). Diese Funktion kann Hunderte, wenn nicht Tausende Male aufgerufen werden. Achten Sie darauf, keinen langsamen Algorithmus zu dieser Funktion hinzuzufügen (Anpassung).
3. cr - C reate R eplace - Erzeugt und führt ein Suchen und Ersetzen aus.
  Exemple : href="..." (innerhalb eines beliebigen HTML-Tags).
4. cri - C reate R eplace I nline - Erzeugt und führt eine Suche und Ersetzung aus.
  Exemple : url(..) innerhalb der alle style Attribut innerhalb von HTML-Tags.

Testfall

Öffnen Sie eine beliebige Seite, und fügen Sie das folgende Bookmarklet in die Adressleiste ein:

javascript:void(function(){var s=document.createElement("script");s.src="http://rob.lekensteyn.nl/rel_to_abs.js";document.body.appendChild(s)})();

Der injizierte Code enthält die beiden oben definierten Funktionen sowie den unten dargestellten Testfall. Hinweis : Der Testfall macht no den HTML-Code der Seite ändern, sondern die geparsten Ergebnisse in einem Textfeld anzeigen (optional).

var t=(new Date).getTime();
  var result = replace_all_rel_by_abs(document.documentElement.innerHTML);
  if(confirm((new Date).getTime()-t+" milliseconds to execute\n\nPut results in new textarea?")){
    var txt = document.createElement("textarea");
    txt.style.cssText = "position:fixed;top:0;left:0;width:100%;height:99%"
    txt.ondblclick = function(){this.parentNode.removeChild(this)}
    txt.value = result;
    document.body.appendChild(txt);
}

Siehe auch:

Antwort: Parsing und Bereinigung von HTML-Zeichenfolgen

Beantwortet el 25 de September, 2011 von Rob W (327048 Punkte )

Answer 3

3voto

liberborn Punkte 149

Dies ist Rob W Antwort "Erweiterte Funktionen zur Ersetzung von HTML-Zeichenfolgen" im aktuellen Thread plus einige Code-Refactoring von mir zu machen JSLint glücklich.

Ich sollte es als Antwortkommentar posten, aber ich habe nicht genug Rufpunkte.

/*jslint browser: true */
/*jslint regexp: true */
/*jslint unparam: true*/
/*jshint strict: false */

/**
 * convertRelToAbsUrl
 *
 * https://stackoverflow.com/a/7544757/1983903
 * 
 * @param  {String} url
 * @return {String} updated url
 */
function convertRelToAbsUrl(url) {
    var baseUrl = null;

    if (/^(https?|file|ftps?|mailto|javascript|data:image\/[^;]{2,9};):/i.test(url)) {
        return url; // url is already absolute
    }

    baseUrl = location.href.match(/^(.+)\/?(?:#.+)?$/)[0] + '/';

    if (url.substring(0, 2) === '//') {
        return location.protocol + url;
    }
    if (url.charAt(0) === '/') {
        return location.protocol + '//' + location.host + url;
    }
    if (url.substring(0, 2) === './') {
        url = '.' + url;
    } else if (/^\s*$/.test(url)) {
        return ''; // empty = return nothing
    }

    url = baseUrl + '../' + url;

    while (/\/\.\.\//.test(url)) {
        url = url.replace(/[^\/]+\/+\.\.\//g, '');
    }

    url = url.replace(/\.$/, '').replace(/\/\./g, '').replace(/"/g, '%22')
            .replace(/'/g, '%27').replace(/</g, '%3C').replace(/>/g, '%3E');

    return url;
}

/**
 * convertAllRelativeToAbsoluteUrls
 *
 * https://stackoverflow.com/a/7544757/1983903
 * 
 * @param  {String} html
 * @return {String} updated html
 */
function convertAllRelativeToAbsoluteUrls(html) {
    var me = this,
        att = '[^-a-z0-9:._]',
        entityEnd = '(?:;|(?!\\d))',
        ents = {
            ' ' : '(?:\\s|&nbsp;?|&#0*32' + entityEnd + '|&#x0*20' + entityEnd + ')',
            '(' : '(?:\\(|&#0*40' + entityEnd + '|&#x0*28' + entityEnd + ')',
            ')' : '(?:\\)|&#0*41' + entityEnd + '|&#x0*29' + entityEnd + ')',
            '.' : '(?:\\.|&#0*46' + entityEnd + '|&#x0*2e' + entityEnd + ')'
        },
        charMap = {},
        s = ents[' '] + '*', // short-hand for common use
        any = '(?:[^>\"\']*(?:\"[^\"]*\"|\'[^\']*\'))*?[^>]*',
        slashRE = null,
        dotRE = null;

    function ae(string) {
        var allCharsLowerCase = string.toLowerCase(),
            allCharsUpperCase = string.toUpperCase(),
            reRes = '',
            charLowerCase = null,
            charUpperCase = null,
            reSub = null,
            i = null;

        if (ents[string]) {
            return ents[string];
        }

        for (i = 0; i < string.length; i++) {
            charLowerCase = allCharsLowerCase.charAt(i);
            if (charMap[charLowerCase]) {
                reRes += charMap[charLowerCase];
                continue;
            }
            charUpperCase = allCharsUpperCase.charAt(i);
            reSub = [charLowerCase];
            reSub.push('&#0*' + charLowerCase.charCodeAt(0) + entityEnd);
            reSub.push('&#x0*' + charLowerCase.charCodeAt(0).toString(16) + entityEnd);

            if (charLowerCase !== charUpperCase) {
                reSub.push('&#0*' + charUpperCase.charCodeAt(0) + entityEnd);
                reSub.push('&#x0*' + charUpperCase.charCodeAt(0).toString(16) + entityEnd);
            }
            reSub = '(?:' + reSub.join('|') + ')';
            reRes += (charMap[charLowerCase] = reSub);
        }
        return (ents[string] = reRes);
    }

    function by(match, group1, group2, group3) {
        return group1 + me.convertRelToAbsUrl(group2) + group3;
    }

    slashRE = new RegExp(ae('/'), 'g');
    dotRE = new RegExp(ae('.'), 'g');

    function by2(match, group1, group2, group3) {
        group2 = group2.replace(slashRE, '/').replace(dotRE, '.');
        return group1 + me.convertRelToAbsUrl(group2) + group3;
    }

    function cr(selector, attribute, marker, delimiter, end) {
        var re1 = null,
            re2 = null,
            re3 = null;

        if (typeof selector === 'string') {
            selector = new RegExp(selector, 'gi');
        }

        attribute = att + attribute;
        marker = typeof marker === 'string' ? marker : '\\s*=\\s*';
        delimiter = typeof delimiter === 'string' ? delimiter : '';
        end = typeof end === 'string' ? '?)(' + end : ')(';

        re1 = new RegExp('(' + attribute + marker + '")([^"' + delimiter + ']+' + end + ')', 'gi');
        re2 = new RegExp('(' + attribute + marker + '\')([^\'' + delimiter + ']+' + end + ')', 'gi');
        re3 = new RegExp('(' + attribute + marker + ')([^"\'][^\\s>' + delimiter + ']*' + end + ')', 'gi');

        html = html.replace(selector, function (match) {
            return match.replace(re1, by).replace(re2, by).replace(re3, by);
        });
    }

    function cri(selector, attribute, front, flags, delimiter, end) {
        var re1 = null,
            re2 = null,
            at1 = null,
            at2 = null,
            at3 = null,
            handleAttr = null;

        if (typeof selector === 'string') {
            selector = new RegExp(selector, 'gi');
        }

        attribute = att + attribute;
        flags = typeof flags === 'string' ? flags : 'gi';
        re1 = new RegExp('(' + attribute + '\\s*=\\s*")([^"]*)', 'gi');
        re2 = new RegExp("(" + attribute + "\\s*=\\s*')([^']+)", 'gi');
        at1 = new RegExp('(' + front + ')([^"]+)(")', flags);
        at2 = new RegExp("(" + front + ")([^']+)(')", flags);

        if (typeof delimiter === 'string') {
            end = typeof end === 'string' ? end : '';
            at3 = new RegExp('(' + front + ')([^\"\'][^' + delimiter + ']*' + (end ? '?)(' + end + ')' : ')()'), flags);
            handleAttr = function (match, g1, g2) {
                return g1 + g2.replace(at1, by2).replace(at2, by2).replace(at3, by2);
            };
        } else {
            handleAttr = function (match, g1, g2) {
                return g1 + g2.replace(at1, by2).replace(at2, by2);
            };
        }
        html = html.replace(selector, function (match) {
            return match.replace(re1, handleAttr).replace(re2, handleAttr);
        });
    }

    cri('<meta' + any + att + 'http-equiv\\s*=\\s*(?:\"' + ae('refresh')
        + '\"' + any + '>|\'' + ae('refresh') + '\'' + any + '>|' + ae('refresh')
        + '(?:' + ae(' ') + any + '>|>))', 'content', ae('url') + s + ae('=') + s, 'i');

    cr('<' + any + att + 'href\\s*=' + any + '>', 'href'); /* Linked elements */
    cr('<' + any + att + 'src\\s*=' + any + '>', 'src'); /* Embedded elements */

    cr('<object' + any + att + 'data\\s*=' + any + '>', 'data'); /* <object data= > */
    cr('<applet' + any + att + 'codebase\\s*=' + any + '>', 'codebase'); /* <applet codebase= > */

    /* <param name=movie value= >*/
    cr('<param' + any + att + 'name\\s*=\\s*(?:\"' + ae('movie') + '\"' + any + '>|\''
        + ae('movie') + '\'' + any + '>|' + ae('movie') + '(?:' + ae(' ') + any + '>|>))', 'value');

    cr(/<style[^>]*>(?:[^"']*(?:"[^"]*"|'[^']*'))*?[^'"]*(?:<\/style|$)/gi,
        'url', '\\s*\\(\\s*', '', '\\s*\\)'); /* <style> */
    cri('<' + any + att + 'style\\s*=' + any + '>', 'style',
        ae('url') + s + ae('(') + s, 0, s + ae(')'), ae(')')); /*< style=" url(...) " > */

    return html;
}

Beantwortet el 5 de November, 2014 von liberborn (149 Punkte )

Answer 4

2voto

tuomassalo Punkte 8077

Eine zuverlässige Methode zur Konvertierung von relativen in absolute Urls ist die Verwendung des eingebauten url Modul .

Exemple :

var url = require('url');
url.resolve("http://www.example.org/foo/bar/", "../baz/qux.html");

>> gives 'http://www.example.org/foo/baz/qux.html'

Beantwortet el 12 de Juli, 2012 von tuomassalo (8077 Punkte )

Answer 5

0voto

Jani Hartikainen Punkte 41573

Wenn Sie eine Regex verwenden, um alle nicht absoluten URLs zu finden, können Sie ihnen einfach die aktuelle URL voranstellen, und das war's.

Die URLs, die Sie korrigieren müssen, sind diejenigen, die entweder nicht mit einem / o http(s):// (oder andere Protokollmarker, falls Sie sich dafür interessieren)

Nehmen wir als Beispiel an, Sie scannen http://www.example.com/ . Wenn Sie auf eine relative URL stoßen, z.B. foo/bar zu verwenden, würden Sie einfach die zu scrappende URL wie folgt voranstellen: http://www.example.com/foo/bar

Für eine Regex, um die URLs von der Seite zu scrapen, gibt es wahrscheinlich viele gute, wenn Sie ein bisschen googeln, also werde ich nicht anfangen, eine schlechte hier zu erfinden :)

Beantwortet el 25 de September, 2011 von Jani Hartikainen (41573 Punkte )

Answer 6

0voto

Geordie Punkte 1391

Aufgrund eines Kommentars von Rob W. über den Base-Tag habe ich eine Injektionsfunktion geschrieben:

function injectBase(html, base) {
  // Remove any <base> elements inside <head>     
  html = html.replace(/(<[^>/]*head[^>]*>)[\s\S]*?(<[^>/]*base[^>]*>)[\s\S]*?(<[^>]*head[^>]*>)/img, "$1 $3");

  // Add <base> just before </head>  
  html = html.replace(/(<[^>/]*head[^>]*>[\s\S]*?)(<[^>]*head[^>]*>)/img, "$1 " + base + " $2");  
  return(html);
}

Beantwortet el 9 de Juni, 2017 von Geordie (1391 Punkte )

Javascript: REGEX um alle relativen Urls in absolute zu ändern

Antworten

Erweiterte Funktionen zur Ersetzung von HTML-Zeichenfolgen

Testfall

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Javascript: REGEX um alle relativen Urls in absolute zu ändern

Antworten

Erweiterte Funktionen zur Ersetzung von HTML-Zeichenfolgen

Testfall

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: