Procesamiento de Cadenas

Creación de Cadenas

Diversos Métodos

# Comillas simples
name = 'Python'

# Comillas dobles
message = "Hello, World!"

# Comillas triples (multilínea)
text = """첫 번째 줄
두 번째 줄
세 번째 줄"""

poem = '''장미는 빨갛고
제비꽃은 파랗다'''

# Secuencias de escape
quote = "He said, \"Hello!\""
path = "C:\\Users\\Documents"
new_line = "첫 줄\n두 번째 줄"
tab = "이름\t나이"

# Cadena raw (ignora escape)
path = r"C:\Users\Documents"

Indexación y Segmentación de Cadenas

Indexación

text = "Python"

# Índice positivo (desde la izquierda: 0, 1, 2...)
print(text[0])   # P
print(text[1])   # y
print(text[5])   # n

# Índice negativo (desde la derecha: -1, -2, -3...)
print(text[-1])  # n
print(text[-2])  # o
print(text[-6])  # P

# Error
# print(text[10])  # IndexError

Segmentación

text = "Python Programming"

# [inicio:fin] - fin no incluido
print(text[0:6])    # Python
print(text[7:18])   # Programming

# Se puede omitir
print(text[:6])     # Python (desde el principio)
print(text[7:])     # Programming (hasta el final)
print(text[:])      # Python Programming (completo)

# Índice negativo
print(text[-11:])   # Programming
print(text[:-12])   # Python

# Especificar paso [inicio:fin:paso]
print(text[::2])    # Pto rgamn (cada 2 caracteres)
print(text[::-1])   # gnimmargorP nohtyP (invertido)

# Ejemplo práctico
url = "https://www.example.com"
domain = url[8:-4]  # www.example
print(domain)

Operaciones con Cadenas

Concatenación y Repetición

# Concatenación (+)
first = "Hello"
second = "World"
greeting = first + " " + second
print(greeting)  # Hello World

# Repetición (*)
line = "=" * 20
print(line)  # ====================

border = "-" * 10
print(f"{border} 제목 {border}")
# ---------- 제목 ----------

# Unir múltiples cadenas
words = ["Python", "is", "awesome"]
sentence = " ".join(words)
print(sentence)  # Python is awesome

Comparación

# Igualdad/Desigualdad
print("hello" == "hello")   # True
print("hello" != "Hello")   # True

# Comparación de tamaño (lexicográfica)
print("apple" < "banana")   # True
print("apple" < "Apple")    # False (mayúsculas primero)

# Prueba de pertenencia
text = "Python Programming"
print("Python" in text)     # True
print("Java" in text)       # False
print("Java" not in text)   # True

Métodos de Cadenas

Conversión de Mayúsculas/Minúsculas

text = "Hello, Python!"

print(text.upper())        # HELLO, PYTHON!
print(text.lower())        # hello, python!
print(text.capitalize())   # Hello, python!
print(text.title())        # Hello, Python!
print(text.swapcase())     # hELLO, pYTHON!

# Ejemplo práctico - normalizar entrada del usuario
user_input = "  YES  "
if user_input.strip().lower() == "yes":
    print("확인되었습니다")

Búsqueda y Verificación

text = "Python Programming"

# Encontrar
print(text.find("Python"))      # 0 (primera posición)
print(text.find("Java"))        # -1 (no encontrado)
print(text.index("Programming"))  # 7
# print(text.index("Java"))     # ValueError

# Contar
print(text.count("o"))          # 1
print(text.count("m"))          # 3

# Verificar inicio/fin
print(text.startswith("Python"))  # True
print(text.endswith("ing"))       # True

# Verificar pertenencia
print("gram" in text)            # True

Verificación de Tipo de Carácter

# Solo alfabético
print("abc".isalpha())       # True
print("abc123".isalpha())    # False

# Solo dígitos
print("123".isdigit())       # True
print("12.3".isdigit())      # False

# Alfanumérico
print("abc123".isalnum())    # True
print("abc 123".isalnum())   # False

# Solo espacios en blanco
print("   ".isspace())       # True
print("  a  ".isspace())     # False

# Mayúsculas/minúsculas
print("ABC".isupper())       # True
print("abc".islower())       # True

# Ejemplo práctico - validación de contraseña
password = "Pass123"
has_digit = any(c.isdigit() for c in password)
has_upper = any(c.isupper() for c in password)
has_lower = any(c.islower() for c in password)

if len(password) >= 8 and has_digit and has_upper and has_lower:
    print("강한 비밀번호입니다")

Eliminación de Espacios en Blanco

text = "   hello world   "

print(text.strip())    # "hello world" (ambos lados)
print(text.lstrip())   # "hello world   " (izquierda)
print(text.rstrip())   # "   hello world" (derecha)

# Eliminar caracteres específicos
url = "https://example.com/"
print(url.strip("https://"))  # example.com/
print(url.rstrip("/"))         # https://example.com

# Ejemplo práctico - análisis CSV
data = "  홍길동,  25,  서울  "
parts = [part.strip() for part in data.split(",")]
print(parts)  # ['홍길동', '25', '서울']

Transformación y Reemplazo

text = "Hello, Python!"

# Reemplazar
print(text.replace("Python", "World"))  # Hello, World!
print(text.replace("l", "L"))           # HeLLo, Python!
print(text.replace("l", "L", 1))        # HeLlo, Python! (solo 1)

# Dividir
words = text.split(", ")
print(words)  # ['Hello', 'Python!']

csv = "홍길동,25,서울"
data = csv.split(",")
print(data)   # ['홍길동', '25', '서울']

# Unir
words = ["Python", "is", "fun"]
sentence = " ".join(words)
print(sentence)  # Python is fun

# Unir con carácter específico
print("-".join(words))  # Python-is-fun

# Dividir líneas
text = """첫 줄
두 번째 줄
세 번째 줄"""
lines = text.splitlines()
print(lines)  # ['첫 줄', '두 번째 줄', '세 번째 줄']

Alineación

# Alinear a la izquierda
print("Python".ljust(10))      # "Python    "
print("Python".ljust(10, "-")) # "Python----"

# Alinear a la derecha
print("Python".rjust(10))      # "    Python"
print("Python".rjust(10, "0")) # "0000Python"

# Centrar
print("Python".center(10))     # "  Python  "
print("Python".center(10, "*"))# "**Python**"

# Ejemplo práctico - salida de tabla
print("이름".ljust(10) + "나이".rjust(5))
print("홍길동".ljust(10) + "25".rjust(5))
print("김철수".ljust(10) + "30".rjust(5))

Formateo de Cadenas

f-string (Python 3.6+, recomendado)

name = "홍길동"
age = 25
height = 175.5

# Uso básico
print(f"이름: {name}, 나이: {age}")

# Expresiones
print(f"내년 나이: {age + 1}")
print(f"키(cm): {height}")

# Especificadores de formato
price = 1234567
print(f"가격: {price:,}원")        # 가격: 1,234,567원

pi = 3.14159265
print(f"원주율: {pi:.2f}")         # 원주율: 3.14

# Alineación y ancho
print(f"{'Python':>10}")          # "    Python"
print(f"{'Python':<10}")          # "Python    "
print(f"{'Python':^10}")          # "  Python  "
print(f"{'Python':*^10}")         # "**Python**"

# Bases numéricas
num = 255
print(f"10진수: {num}")           # 10진수: 255
print(f"16진수: {num:x}")         # 16진수: ff
print(f"8진수: {num:o}")          # 8진수: 377
print(f"2진수: {num:b}")          # 2진수: 11111111

Método format()

# Basado en posición
print("이름: {}, 나이: {}".format("홍길동", 25))

# Especificar índice
print("{1}, {0}".format("World", "Hello"))  # Hello, World

# Especificar nombre
print("이름: {name}, 나이: {age}".format(name="홍길동", age=25))

# Especificar formato
print("가격: {:,}원".format(1234567))
print("비율: {:.1%}".format(0.856))

Formateo % (Heredado)

name = "홍길동"
age = 25

print("이름: %s, 나이: %d" % (name, age))
print("비율: %.2f%%" % 85.678)

Ejemplos Prácticos

Validación de Correo Electrónico

def validate_email(email):
    """Validación simple de correo electrónico"""
    # Verificar si @ está incluido
    if "@" not in email:
        return False

    # Dividir por @
    parts = email.split("@")
    if len(parts) != 2:
        return False

    local, domain = parts

    # Validar parte local y dominio
    if not local or not domain:
        return False

    # Verificar si el dominio contiene .
    if "." not in domain:
        return False

    return True

# Prueba
emails = [
    "user@example.com",      # ✅
    "invalid.email",         # ❌
    "@example.com",          # ❌
    "user@",                 # ❌
]

for email in emails:
    result = "유효" if validate_email(email) else "무효"
    print(f"{email}: {result}")

Enmascaramiento de Texto

def mask_phone(phone):
    """Enmascarar número de teléfono"""
    if len(phone) == 11:
        return phone[:3] + "****" + phone[7:]
    elif len(phone) == 10:
        return phone[:3] + "***" + phone[6:]
    return phone

def mask_email(email):
    """Enmascarar correo electrónico"""
    local, domain = email.split("@")
    if len(local) <= 2:
        masked_local = local[0] + "*"
    else:
        masked_local = local[0] + "*" * (len(local) - 2) + local[-1]
    return f"{masked_local}@{domain}"

# Uso
print(mask_phone("01012345678"))    # 010****5678
print(mask_email("hong@example.com"))  # h**g@example.com

Analizador de Cadenas

def analyze_string(text):
    """Análisis detallado de cadena"""
    return {
        "길이": len(text),
        "단어수": len(text.split()),
        "대문자": sum(1 for c in text if c.isupper()),
        "소문자": sum(1 for c in text if c.islower()),
        "숫자": sum(1 for c in text if c.isdigit()),
        "공백": sum(1 for c in text if c.isspace()),
        "특수문자": sum(1 for c in text if not c.isalnum() and not c.isspace())
    }

text = "Hello Python 2024! Welcome to coding."
result = analyze_string(text)

print("=== 문자열 분석 ===")
for key, value in result.items():
    print(f"{key}: {value}")

Analizador de URL

def parse_url(url):
    """Analizar URL"""
    # Dividir protocolo
    if "://" in url:
        protocol, rest = url.split("://", 1)
    else:
        protocol = "http"
        rest = url

    # Dividir ruta
    if "/" in rest:
        domain, path = rest.split("/", 1)
        path = "/" + path
    else:
        domain = rest
        path = "/"

    # Dividir puerto
    if ":" in domain:
        domain, port = domain.split(":")
    else:
        port = "80" if protocol == "http" else "443"

    return {
        "프로토콜": protocol,
        "도메인": domain,
        "포트": port,
        "경로": path
    }

url = "https://www.example.com:8080/api/users"
result = parse_url(url)

for key, value in result.items():
    print(f"{key}: {value}")

Unicode y Codificación

Trabajar con Unicode

# Coreano
text = "안녕하세요"
print(len(text))  # 5

# Emoji
emoji = "😀🎉"
print(len(emoji))  # 2

# Puntos de código Unicode
print(ord("A"))      # 65
print(chr(65))       # A
print(ord("가"))     # 44032
print(chr(44032))    # 가

Codificación/Decodificación

text = "안녕하세요"

# Codificación (cadena → bytes)
utf8_bytes = text.encode("utf-8")
print(utf8_bytes)  # b'\xec\x95\x88\xeb\x85\x95...'

euckr_bytes = text.encode("euc-kr")
print(euckr_bytes)

# Decodificación (bytes → cadena)
decoded = utf8_bytes.decode("utf-8")
print(decoded)  # 안녕하세요

Preguntas Frecuentes

P1. ¿Son las cadenas inmutables?

R: Sí, las cadenas son inmutables.

text = "hello"
# text[0] = "H"  # ❌ TypeError

# Crear nueva cadena
text = "H" + text[1:]  # ✅ "Hello"

P2. + vs join, ¿cuál es más rápido?

R: join es más rápido al concatenar muchas cadenas.

# ❌ Lento (muchas creaciones de cadenas)
result = ""
for i in range(1000):
    result += str(i)

# ✅ Rápido
result = "".join(str(i) for i in range(1000))

P3. ¿Cómo manejar la indentación en cadenas multilínea?

R: Use el módulo textwrap

from textwrap import dedent

text = dedent("""
    첫 번째 줄
    두 번째 줄
    세 번째 줄
""").strip()

print(text)
# 첫 번째 줄
# 두 번째 줄
# 세 번째 줄

P4. ¿Necesito expresiones regulares?

R: Son necesarias para coincidencias de patrones complejos.

import re

# Caso simple: métodos de cadena
email = "user@example.com"
if "@" in email and "." in email:
    print("이메일 형식")

# Caso complejo: expresiones regulares
pattern = r"^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$"
if re.match(pattern, email):
    print("유효한 이메일")

Próximos Pasos

¡Ha dominado el procesamiento de cadenas!

Puntos Clave:
✅ Indexación y segmentación
✅ Varios métodos de cadenas
✅ Formateo de cadenas (f-string)
✅ Buscar, transformar, validar
✅ Ejemplos prácticos

Próximo Paso: ¡Aprenda colecciones en Listas y Tuplas!

Creación de Cadenas​

Diversos Métodos​

Indexación y Segmentación de Cadenas​

Indexación​

Segmentación​

Operaciones con Cadenas​

Concatenación y Repetición​

Comparación​

Métodos de Cadenas​

Conversión de Mayúsculas/Minúsculas​

Búsqueda y Verificación​

Verificación de Tipo de Carácter​

Eliminación de Espacios en Blanco​

Transformación y Reemplazo​

Alineación​

Formateo de Cadenas​

f-string (Python 3.6+, recomendado)​

Método format()​

Formateo % (Heredado)​

Ejemplos Prácticos​

Validación de Correo Electrónico​

Enmascaramiento de Texto​

Analizador de Cadenas​

Analizador de URL​

Unicode y Codificación​

Trabajar con Unicode​

Codificación/Decodificación​

Preguntas Frecuentes​

P1. ¿Son las cadenas inmutables?​

P2. + vs join, ¿cuál es más rápido?​

P3. ¿Cómo manejar la indentación en cadenas multilínea?​

P4. ¿Necesito expresiones regulares?​

Próximos Pasos​