# Python imports
from collections import Counter, defaultdict
from pathlib import Path
from typing import Callable, Dict, Generator, Iterable, List, Set, Tuple

# Paths to data
testpath = Path("day14_test.txt")
datapath = Path("day14_data.txt")


def load_input(fpath: Path) -> Tuple[str, Dict]:
    """Return starting polymer and rules
    
    :param fpath:  Path to data file
    """
    state = "polymer"  # state for parser
    rules = {}  # holds parsed rules
    
    with fpath.open("r") as ifh:
        for line in [_.strip() for _ in ifh.readlines()]:
            if len(line) == 0:  # switch parser state
                state = "rules"
            elif state == "polymer":  # read in polymer string
                polymer = line.strip()
            elif state == "rules":  # read in rules as dictionary
                key, val = line.strip().split(" -> ")
                rules[key] = val
                
    return polymer, rules


def expand_polymer(polymer: str, rules: Dict) -> str:
    """Expand the polymer, using the passed rules
    
    :param polymer:  current polymer string
    :param rules:  rules for inserting monomers in a pair
    """
    expanding = []  # hold list of new polymer elements
    
    # Split polymer into consecutive pairs, and apply rules to each pair
    polysplit = [polymer[idx:idx+2] for idx in range(len(polymer) - 1)]
    for pair in polysplit:
        expanding.append(f"{pair[0]}{rules[pair]}")
            
    # concatenate polymer elements, and add last character from input
    return "".join(expanding) + polymer[-1]

def polymer_score(polymer: str) -> int:
    """Return difference between counts of most and least abundant monomer
    
    :param polymer:  polymer string
    """
    # Count occurrences of each monomer, and sort by abundance
    counts = sorted([(v, k) for k, v in Counter(list(polymer)).items()])
    
    # Return difference of most and least abundant counts
    return counts[-1][0] - counts[0][0]


polymer, rules = load_input(testpath)
for idx in range(10):
    polymer = expand_polymer(polymer, rules)
    print(f"{idx + 1}: {len(polymer)=}, {polymer_score(polymer)=}")

1: len(polymer)=7, polymer_score(polymer)=1
2: len(polymer)=13, polymer_score(polymer)=5
3: len(polymer)=25, polymer_score(polymer)=7
4: len(polymer)=49, polymer_score(polymer)=18
5: len(polymer)=97, polymer_score(polymer)=33
6: len(polymer)=193, polymer_score(polymer)=82
7: len(polymer)=385, polymer_score(polymer)=160
8: len(polymer)=769, polymer_score(polymer)=366
9: len(polymer)=1537, polymer_score(polymer)=727
10: len(polymer)=3073, polymer_score(polymer)=1588


polymer, rules = load_input(datapath)
for idx in range(10):
    polymer = expand_polymer(polymer, rules)
print(f"{idx + 1}: {len(polymer)=} - {polymer_score(polymer)=}")

10: len(polymer)=19457 - polymer_score(polymer)=2915


def count_pair_freqs(polymer: str) -> Counter:
    """Returns Counter of pair frequencies in a polymer sequence
    
    :param polymer:  polymer string
    """
    return Counter([polymer[idx:idx+2] for idx in range(len(polymer) - 1)])

def make_pair_rules(rules: Dict) -> Dict:
    """Returns new rule dictionary associating one pair with two output pairs
    
    :param rules:  rule dictionary associating one pair with a monomer insert
    """
    return {key: (key[0] + val, val + key[1]) for key, val in rules.items()}

def update_pairs(freqs: Dict, rules: Dict) -> Dict:
    """Returns updated frequency dictionary for each pair on applying rules
    
    :param freqs:  dictionary of symbol pair frequencies
    :param rules:  dictionary of symbol pair updates
    """
    newfreqs = defaultdict(int)  # holds new frequency dictionary
    
    # Update new frequency dictionary with new pair symbols
    for pair in freqs:
        for output in rules[pair]:
            newfreqs[output] += freqs[pair]
            
    return newfreqs

def score_freqs(polymer: str, freqs: Dict) -> int:
    """Return difference in largest and smallest symbol count
    
    :param polymer:  initial polymer string (not current polymer)
    :param freqs:  pair frequency dictionary for current polymer
    """
    letter_counts = defaultdict(int)  # holds counts of individual symbols
    
    # Update letter counts from frequency dictionary
    for key, val in freqs.items():
        letter_counts[key[0]] += val
        letter_counts[key[1]] += val

    # Update/correct counts of start/end symbols in polymer, and sort
    letter_counts[polymer[0]] += 1
    letter_counts[polymer[-1]] += 1
    letter_counts = sorted([(v, k) for k, v in letter_counts.items()])

    return int(0.5 * (letter_counts[-1][0] - letter_counts[0][0]))


polymer, rules = load_input(testpath)
pair_freqs = count_pair_freqs(polymer)
pair_rules = make_pair_rules(rules)
for idx in range(40):
    pair_freqs = update_pairs(pair_freqs, pair_rules)
print(idx + 1, score_freqs(polymer, pair_freqs))

40 2188189693529


polymer, rules = load_input(datapath)
pair_freqs = count_pair_freqs(polymer)
pair_rules = make_pair_rules(rules)
for idx in range(40):
    pair_freqs = update_pairs(pair_freqs, pair_rules)
print(idx + 1, score_freqs(polymer, pair_freqs))

40 3353146900153

Day 14: Extended Polymerization¶

Puzzle 2¶