FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4396, 417 aa 1>>>pF1KE4396 417 - 417 aa - 417 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1306+/-0.000826; mu= 13.6583+/- 0.050 mean_var=120.6123+/-25.907, 0's: 0 Z-trim(110.1): 115 B-trim: 2 in 1/52 Lambda= 0.116783 statistics sampled from 11195 (11342) to 11195 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.707), E-opt: 0.2 (0.348), width: 16 Scan time: 2.730 The best scores are: opt bits E(32554) CCDS12640.1 PVR gene_id:5817|Hs108|chr19 ( 417) 2825 487.2 1.2e-137 CCDS46107.1 PVR gene_id:5817|Hs108|chr19 ( 392) 2631 454.5 8.2e-128 CCDS46105.1 PVR gene_id:5817|Hs108|chr19 ( 372) 2300 398.7 4.8e-111 CCDS46106.1 PVR gene_id:5817|Hs108|chr19 ( 364) 2242 388.9 4.2e-108 CCDS12645.1 NECTIN2 gene_id:5819|Hs108|chr19 ( 479) 1008 181.1 2e-45 CCDS42576.1 NECTIN2 gene_id:5819|Hs108|chr19 ( 538) 1006 180.8 2.7e-45 CCDS8425.1 NECTIN1 gene_id:5818|Hs108|chr11 ( 458) 657 122.0 1.2e-27 CCDS8426.1 NECTIN1 gene_id:5818|Hs108|chr11 ( 517) 650 120.8 3e-27 CCDS8427.1 NECTIN1 gene_id:5818|Hs108|chr11 ( 352) 615 114.8 1.3e-25 CCDS58843.1 NECTIN3 gene_id:25945|Hs108|chr3 ( 487) 546 103.3 5.4e-22 CCDS2957.1 NECTIN3 gene_id:25945|Hs108|chr3 ( 549) 532 101.0 3e-21 CCDS58842.1 NECTIN3 gene_id:25945|Hs108|chr3 ( 366) 520 98.8 9.1e-21 CCDS1216.1 NECTIN4 gene_id:81607|Hs108|chr1 ( 510) 474 91.2 2.5e-18 CCDS44251.1 CADM3 gene_id:57863|Hs108|chr1 ( 398) 349 70.0 4.5e-12 CCDS1182.1 CADM3 gene_id:57863|Hs108|chr1 ( 432) 349 70.0 4.8e-12 >>CCDS12640.1 PVR gene_id:5817|Hs108|chr19 (417 aa) initn: 2825 init1: 2825 opt: 2825 Z-score: 2584.4 bits: 487.2 E(32554): 1.2e-137 Smith-Waterman score: 2825; 100.0% identity (100.0% similar) in 417 aa overlap (1-417:1-417) 10 20 30 40 50 60 pF1KE4 MARAMAAAWPLLLVALLVLSWPPPGTGDVVVQAPTQVPGFLGDSVTLPCYLQVPNMEVTH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MARAMAAAWPLLLVALLVLSWPPPGTGDVVVQAPTQVPGFLGDSVTLPCYLQVPNMEVTH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 VSQLTWARHGESGSMAVFHQTQGPSYSESKRLEFVAARLGAELRNASLRMFGLRVEDEGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VSQLTWARHGESGSMAVFHQTQGPSYSESKRLEFVAARLGAELRNASLRMFGLRVEDEGN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 YTCLFVTFPQGSRSVDIWLRVLAKPQNTAEVQKVQLTGEPVPMARCVSTGGRPPAQITWH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 YTCLFVTFPQGSRSVDIWLRVLAKPQNTAEVQKVQLTGEPVPMARCVSTGGRPPAQITWH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 SDLGGMPNTSQVPGFLSGTVTVTSLWILVPSSQVDGKNVTCKVEHESFEKPQLLTVNLTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SDLGGMPNTSQVPGFLSGTVTVTSLWILVPSSQVDGKNVTCKVEHESFEKPQLLTVNLTV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 YYPPEVSISGYDNNWYLGQNEATLTCDARSNPEPTGYNWSTTMGPLPPFAVAQGAQLLIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 YYPPEVSISGYDNNWYLGQNEATLTCDARSNPEPTGYNWSTTMGPLPPFAVAQGAQLLIR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 PVDKPINTTLICNVTNALGARQAELTVQVKEGPPSEHSGMSRNAIIFLVLGILVFLILLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PVDKPINTTLICNVTNALGARQAELTVQVKEGPPSEHSGMSRNAIIFLVLGILVFLILLG 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 IGIYFYWSKCSREVLWHCHLCPSSTEHASASANGHVSYSAVSRENSSSQDPQTEGTR ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 IGIYFYWSKCSREVLWHCHLCPSSTEHASASANGHVSYSAVSRENSSSQDPQTEGTR 370 380 390 400 410 >>CCDS46107.1 PVR gene_id:5817|Hs108|chr19 (392 aa) initn: 2698 init1: 2631 opt: 2631 Z-score: 2408.1 bits: 454.5 E(32554): 8.2e-128 Smith-Waterman score: 2631; 99.2% identity (99.5% similar) in 389 aa overlap (1-389:1-389) 10 20 30 40 50 60 pF1KE4 MARAMAAAWPLLLVALLVLSWPPPGTGDVVVQAPTQVPGFLGDSVTLPCYLQVPNMEVTH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 MARAMAAAWPLLLVALLVLSWPPPGTGDVVVQAPTQVPGFLGDSVTLPCYLQVPNMEVTH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 VSQLTWARHGESGSMAVFHQTQGPSYSESKRLEFVAARLGAELRNASLRMFGLRVEDEGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 VSQLTWARHGESGSMAVFHQTQGPSYSESKRLEFVAARLGAELRNASLRMFGLRVEDEGN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 YTCLFVTFPQGSRSVDIWLRVLAKPQNTAEVQKVQLTGEPVPMARCVSTGGRPPAQITWH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 YTCLFVTFPQGSRSVDIWLRVLAKPQNTAEVQKVQLTGEPVPMARCVSTGGRPPAQITWH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 SDLGGMPNTSQVPGFLSGTVTVTSLWILVPSSQVDGKNVTCKVEHESFEKPQLLTVNLTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 SDLGGMPNTSQVPGFLSGTVTVTSLWILVPSSQVDGKNVTCKVEHESFEKPQLLTVNLTV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 YYPPEVSISGYDNNWYLGQNEATLTCDARSNPEPTGYNWSTTMGPLPPFAVAQGAQLLIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 YYPPEVSISGYDNNWYLGQNEATLTCDARSNPEPTGYNWSTTMGPLPPFAVAQGAQLLIR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 PVDKPINTTLICNVTNALGARQAELTVQVKEGPPSEHSGMSRNAIIFLVLGILVFLILLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 PVDKPINTTLICNVTNALGARQAELTVQVKEGPPSEHSGMSRNAIIFLVLGILVFLILLG 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 IGIYFYWSKCSREVLWHCHLCPSSTEHASASANGHVSYSAVSRENSSSQDPQTEGTR :::::::::::::::::::::::: .: : CCDS46 IGIYFYWSKCSREVLWHCHLCPSSEHHQSCRN 370 380 390 >>CCDS46105.1 PVR gene_id:5817|Hs108|chr19 (372 aa) initn: 2300 init1: 2300 opt: 2300 Z-score: 2107.0 bits: 398.7 E(32554): 4.8e-111 Smith-Waterman score: 2407; 89.2% identity (89.2% similar) in 417 aa overlap (1-417:1-372) 10 20 30 40 50 60 pF1KE4 MARAMAAAWPLLLVALLVLSWPPPGTGDVVVQAPTQVPGFLGDSVTLPCYLQVPNMEVTH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 MARAMAAAWPLLLVALLVLSWPPPGTGDVVVQAPTQVPGFLGDSVTLPCYLQVPNMEVTH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 VSQLTWARHGESGSMAVFHQTQGPSYSESKRLEFVAARLGAELRNASLRMFGLRVEDEGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 VSQLTWARHGESGSMAVFHQTQGPSYSESKRLEFVAARLGAELRNASLRMFGLRVEDEGN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 YTCLFVTFPQGSRSVDIWLRVLAKPQNTAEVQKVQLTGEPVPMARCVSTGGRPPAQITWH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 YTCLFVTFPQGSRSVDIWLRVLAKPQNTAEVQKVQLTGEPVPMARCVSTGGRPPAQITWH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 SDLGGMPNTSQVPGFLSGTVTVTSLWILVPSSQVDGKNVTCKVEHESFEKPQLLTVNLTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 SDLGGMPNTSQVPGFLSGTVTVTSLWILVPSSQVDGKNVTCKVEHESFEKPQLLTVNLTV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 YYPPEVSISGYDNNWYLGQNEATLTCDARSNPEPTGYNWSTTMGPLPPFAVAQGAQLLIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 YYPPEVSISGYDNNWYLGQNEATLTCDARSNPEPTGYNWSTTMGPLPPFAVAQGAQLLIR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 PVDKPINTTLICNVTNALGARQAELTVQVKEGPPSEHSGMSRNAIIFLVLGILVFLILLG ::::::::::::::::::::::::::::::::::::::: CCDS46 PVDKPINTTLICNVTNALGARQAELTVQVKEGPPSEHSG--------------------- 310 320 330 370 380 390 400 410 pF1KE4 IGIYFYWSKCSREVLWHCHLCPSSTEHASASANGHVSYSAVSRENSSSQDPQTEGTR ::::::::::::::::::::::::::::::::: CCDS46 ------------------------TEHASASANGHVSYSAVSRENSSSQDPQTEGTR 340 350 360 370 >>CCDS46106.1 PVR gene_id:5817|Hs108|chr19 (364 aa) initn: 2425 init1: 2232 opt: 2242 Z-score: 2054.3 bits: 388.9 E(32554): 4.2e-108 Smith-Waterman score: 2323; 87.1% identity (87.3% similar) in 417 aa overlap (1-417:1-364) 10 20 30 40 50 60 pF1KE4 MARAMAAAWPLLLVALLVLSWPPPGTGDVVVQAPTQVPGFLGDSVTLPCYLQVPNMEVTH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 MARAMAAAWPLLLVALLVLSWPPPGTGDVVVQAPTQVPGFLGDSVTLPCYLQVPNMEVTH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 VSQLTWARHGESGSMAVFHQTQGPSYSESKRLEFVAARLGAELRNASLRMFGLRVEDEGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 VSQLTWARHGESGSMAVFHQTQGPSYSESKRLEFVAARLGAELRNASLRMFGLRVEDEGN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 YTCLFVTFPQGSRSVDIWLRVLAKPQNTAEVQKVQLTGEPVPMARCVSTGGRPPAQITWH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 YTCLFVTFPQGSRSVDIWLRVLAKPQNTAEVQKVQLTGEPVPMARCVSTGGRPPAQITWH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 SDLGGMPNTSQVPGFLSGTVTVTSLWILVPSSQVDGKNVTCKVEHESFEKPQLLTVNLTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 SDLGGMPNTSQVPGFLSGTVTVTSLWILVPSSQVDGKNVTCKVEHESFEKPQLLTVNLTV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 YYPPEVSISGYDNNWYLGQNEATLTCDARSNPEPTGYNWSTTMGPLPPFAVAQGAQLLIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 YYPPEVSISGYDNNWYLGQNEATLTCDARSNPEPTGYNWSTTMGPLPPFAVAQGAQLLIR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 PVDKPINTTLICNVTNALGARQAELTVQVKEGPPSEHSGMSRNAIIFLVLGILVFLILLG :::::::::::::::::::::::::::::: CCDS46 PVDKPINTTLICNVTNALGARQAELTVQVK------------------------------ 310 320 330 370 380 390 400 410 pF1KE4 IGIYFYWSKCSREVLWHCHLCPSSTEHASASANGHVSYSAVSRENSSSQDPQTEGTR .::::::::::::::::::::::::::::::::: CCDS46 -----------------------GTEHASASANGHVSYSAVSRENSSSQDPQTEGTR 340 350 360 >>CCDS12645.1 NECTIN2 gene_id:5819|Hs108|chr19 (479 aa) initn: 1120 init1: 956 opt: 1008 Z-score: 929.2 bits: 181.1 E(32554): 2e-45 Smith-Waterman score: 1135; 49.6% identity (72.3% similar) in 379 aa overlap (9-372:19-389) 10 20 30 40 50 pF1KE4 MARAMAAAWPLLLVALLVLSWPPPGTGDVVVQAPTQVPGFLGDSVTLPCY :::::. :: :. :: ::. .: : :: .: :::. CCDS12 MARAAALLPSRSPPTPLLWPLLLLLLL-----ETGAQDVRVQVLPEVRGQLGGTVELPCH 10 20 30 40 50 60 70 80 90 100 pF1KE4 LQVPNMEVTHVSQLTWARHGESGS---MAVFHQTQGPSYSE----SKRLEFVAARLG--- : .: . ..: .:: : .. .:.:: .:::. :.:: ::.:. . CCDS12 L-LPPVPGLYISLVTWQRPDAPANHQNVAAFHPKMGPSFPSPKPGSERLSFVSAKQSTGQ 60 70 80 90 100 110 110 120 130 140 150 pF1KE4 ---AELRNASLRMFGLRVEDEGNYTCLFVTFPQGSRSVDIWLRVLAKPQNTAEVQKVQLT :::..:.: . :: ::::::::: :.:::.:: ::::.:::.: ::.::: .. CCDS12 DTEAELQDATLALHGLTVEDEGNYTCEFATFPKGSVRGMTWLRVIAKPKNQAEAQKVTFS 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE4 GEPVPMARCVSTGGRPPAQITWHSDLGGMPNTSQVPGFLSGTVTVTSLWILVPSSQVDGK .:. .: :.: :::::.:.: :.: . .:: : :.::::::: . ::::...:: CCDS12 QDPTTVALCISKEGRPPARISWLSSLDWEAKETQVSGTLAGTVTVTSRFTLVPSGRADGV 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE4 NVTCKVEHESFEKPQLLTVNLTVYYPPEVSISGYDNNWYLGQNEATLTCDARSNPEPTGY .:::::::::::.: :. :.:.: :::::::::::.:::::...:::.::.::::::::: CCDS12 TVTCKVEHESFEEPALIPVTLSVRYPPEVSISGYDDNWYLGRTDATLSCDVRSNPEPTGY 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE4 NWSTTMGPLPPFAVAQGAQLLIRPVDKPINTTLICNVTNALGARQAELTVQVKEGPPSEH .:::: : .: :::::.::.:. ::. .:::..:.::::.: .:: .. :.: : . CCDS12 DWSTTSGTFPTSAVAQGSQLVIHAVDSLFNTTFVCTVTNAVGMGRAEQVIFVRETPRA-- 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE4 SGMSRNAIIFLVLG--ILVFLILLGIGIYFYWSKCSREVLWHCHLCPSSTEHASASANGH : . . ... ..: .::.:.: : .. : . : CCDS12 SPRDVGPLVWGAVGGTLLVLLLLAGGSLAFILLRVRRRRKSPGGAGGGASGDGGFYDPKA 360 370 380 390 400 410 400 410 pF1KE4 VSYSAVSRENSSSQDPQTEGTR CCDS12 QVLGNGDPVFWTPVVPGPMEPDGKDEEEEEEEEKAEKGLMLPPPPALEDDMESQLDGSLI 420 430 440 450 460 470 >>CCDS42576.1 NECTIN2 gene_id:5819|Hs108|chr19 (538 aa) initn: 1152 init1: 964 opt: 1006 Z-score: 926.7 bits: 180.8 E(32554): 2.7e-45 Smith-Waterman score: 1133; 50.0% identity (72.8% similar) in 368 aa overlap (9-363:19-379) 10 20 30 40 50 pF1KE4 MARAMAAAWPLLLVALLVLSWPPPGTGDVVVQAPTQVPGFLGDSVTLPCY :::::. :: :. :: ::. .: : :: .: :::. CCDS42 MARAAALLPSRSPPTPLLWPLLLLLLL-----ETGAQDVRVQVLPEVRGQLGGTVELPCH 10 20 30 40 50 60 70 80 90 100 pF1KE4 LQVPNMEVTHVSQLTWARHGESGS---MAVFHQTQGPSYSE----SKRLEFVAARLG--- : .: . ..: .:: : .. .:.:: .:::. :.:: ::.:. . CCDS42 L-LPPVPGLYISLVTWQRPDAPANHQNVAAFHPKMGPSFPSPKPGSERLSFVSAKQSTGQ 60 70 80 90 100 110 110 120 130 140 150 pF1KE4 ---AELRNASLRMFGLRVEDEGNYTCLFVTFPQGSRSVDIWLRVLAKPQNTAEVQKVQLT :::..:.: . :: ::::::::: :.:::.:: ::::.:::.: ::.::: .. CCDS42 DTEAELQDATLALHGLTVEDEGNYTCEFATFPKGSVRGMTWLRVIAKPKNQAEAQKVTFS 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE4 GEPVPMARCVSTGGRPPAQITWHSDLGGMPNTSQVPGFLSGTVTVTSLWILVPSSQVDGK .:. .: :.: :::::.:.: :.: . .:: : :.::::::: . ::::...:: CCDS42 QDPTTVALCISKEGRPPARISWLSSLDWEAKETQVSGTLAGTVTVTSRFTLVPSGRADGV 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE4 NVTCKVEHESFEKPQLLTVNLTVYYPPEVSISGYDNNWYLGQNEATLTCDARSNPEPTGY .:::::::::::.: :. :.:.: :::::::::::.:::::...:::.::.::::::::: CCDS42 TVTCKVEHESFEEPALIPVTLSVRYPPEVSISGYDDNWYLGRTDATLSCDVRSNPEPTGY 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE4 NWSTTMGPLPPFAVAQGAQLLIRPVDKPINTTLICNVTNALGARQAELTVQVKEGPPSEH .:::: : .: :::::.::.:. ::. .:::..:.::::.: .:: .. :.: : . CCDS42 DWSTTSGTFPTSAVAQGSQLVIHAVDSLFNTTFVCTVTNAVGMGRAEQVIFVRETPNTAG 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE4 SGMSRNAIIFLVLGILVFLILLGIGIYFYWSKCSREVLWHCHLCPSSTEHASASANGHVS .: . ..:: ... .. . . :: CCDS42 AGAT-GGIIGGIIAAIIATAVAATGILICRQQRKEQTLQGAEEDEDLEGPPSYKPPTPKA 360 370 380 390 400 410 >>CCDS8425.1 NECTIN1 gene_id:5818|Hs108|chr11 (458 aa) initn: 477 init1: 183 opt: 657 Z-score: 609.8 bits: 122.0 E(32554): 1.2e-27 Smith-Waterman score: 657; 32.6% identity (64.2% similar) in 380 aa overlap (1-369:6-372) 10 20 30 40 50 pF1KE4 MARAMAAAWPLLLVALLVLSWPPPGTGDVVVQAPTQVPGFLGDSVTLPCYLQVPN .: : . : : :: . .. ::. . :::. .. ::.: .:.: : . : CCDS84 MARMGLAGAAGRWWGL---ALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANP- 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 MEVTHVSQLTWAR--HGESGSMAVFHQTQGPSY--SESKRLEFVAARLGAELRNASLRMF . ....:.:: . .: . ..:... ..: : .:.:: : . ....:. CCDS84 LPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEF----LRPSFTDGTIRLS 60 70 80 90 100 110 120 130 140 150 160 pF1KE4 GLRVEDEGNYTCLFVTFPQGSRSVDIWLRVLAKPQNTAEVQKVQLTG-----EPVPMARC :..:::: : : :.::: :.: .. : :.::: : : .. : . . : .: : CCDS84 RLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATC 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE4 VSTGGRPPAQITWHSDLGGMPNTSQVPGFLSGTVTVTSLWILVPSSQVDGKNVTCKVEHE .:..:.::. ..:.. : : . ... . .::::: : . :::: .. ....: :... CCDS84 TSANGKPPSVVSWETRLKGEAEYQEIRNP-NGTVTVISRYRLVPSREAHQQSLACIVNYH 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE4 SFEKPQLLTVNLTVYYPPEVSISGYDNNWYLGQNEATLTCDARSNPEPTGYNWSTTMGPL . . ::.: : : :::.: :.:.:::: . .. ::: : .:: : :.:.: : : CCDS84 MDRFKESLTLN--VQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSL 240 250 260 270 280 290 300 310 320 330 340 pF1KE4 PPFAVAQGAQLLIR-PVDKPINTTLICNVTNALGARQAELTVQVKEGPPSEHSGMSRNAI : . ::. :... :.. . : ::..:: .:.:.... :.. : : . :.. .: CCDS84 PKGVEAQNRTLFFKGPINYSLAGTYICEATNPIGTRSGQVEVNITE-KPRPQRGLG-SAA 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE4 IFLVLGILVFLILLGI-GIYFYWSKCSREVLWHCHLCPSSTEHASASANGHVSYSAVSRE .:. . :::::... ..: ... CCDS84 RLLAGTVAVFLILVAVLTVFFLYNRQQKSPPETDGAGTDQPLSQKPEPSPSRQSSLVPED 350 360 370 380 390 400 >>CCDS8426.1 NECTIN1 gene_id:5818|Hs108|chr11 (517 aa) initn: 475 init1: 183 opt: 650 Z-score: 602.8 bits: 120.8 E(32554): 3e-27 Smith-Waterman score: 655; 34.4% identity (63.3% similar) in 381 aa overlap (1-363:6-374) 10 20 30 40 50 pF1KE4 MARAMAAAWPLLLVALLVLSWPPPGTGDVVVQAPTQVPGFLGDSVTLPCYLQVPN .: : . : : :: . .. ::. . :::. .. ::.: .:.: : . : CCDS84 MARMGLAGAAGRWWGL---ALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANP- 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 MEVTHVSQLTWAR--HGESGSMAVFHQTQGPSY--SESKRLEFVAARLGAELRNASLRMF . ....:.:: . .: . ..:... ..: : .:.:: : . ....:. CCDS84 LPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEF----LRPSFTDGTIRLS 60 70 80 90 100 110 120 130 140 150 160 pF1KE4 GLRVEDEGNYTCLFVTFPQGSRSVDIWLRVLAKPQNTAEVQKVQLTG-----EPVPMARC :..:::: : : :.::: :.: .. : :.::: : : .. : . . : .: : CCDS84 RLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATC 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE4 VSTGGRPPAQITWHSDLGGMPNTSQVPGFLSGTVTVTSLWILVPSSQVDGKNVTCKVEHE .:..:.::. ..:.. : : . ... . .::::: : . :::: .. ....: :... CCDS84 TSANGKPPSVVSWETRLKGEAEYQEIRNP-NGTVTVISRYRLVPSREAHQQSLACIVNYH 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE4 SFEKPQLLTVNLTVYYPPEVSISGYDNNWYLGQNEATLTCDARSNPEPTGYNWSTTMGPL . . ::.: : : :::.: :.:.:::: . .. ::: : .:: : :.:.: : : CCDS84 MDRFKESLTLN--VQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSL 240 250 260 270 280 290 300 310 320 330 pF1KE4 PPFAVAQGAQLLIR-PVDKPINTTLICNVTNALGARQAELTVQVKEGP----PSEH---S : . ::. :... :.. . : ::..:: .:.:.... :.. : : : :: . CCDS84 PKGVEAQNRTLFFKGPINYSLAGTYICEATNPIGTRSGQVEVNITEFPYTPSPPEHGRRA 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE4 GMSRNAIIFLVLG-ILVFLILLGIGIYFYWSKCSREVLWHCHLCPSSTEHASASANGHVS : .::: : : ::. ::..: :: CCDS84 GPVPTAIIGGVAGSILLVLIVVG-GIVVALRRRRHTFKGDYSTKKHVYGNGYSKAGIPQH 350 360 370 380 390 400 >>CCDS8427.1 NECTIN1 gene_id:5818|Hs108|chr11 (352 aa) initn: 464 init1: 183 opt: 615 Z-score: 573.0 bits: 114.8 E(32554): 1.3e-25 Smith-Waterman score: 615; 33.3% identity (64.3% similar) in 339 aa overlap (1-329:6-333) 10 20 30 40 50 pF1KE4 MARAMAAAWPLLLVALLVLSWPPPGTGDVVVQAPTQVPGFLGDSVTLPCYLQVPN .: : . : : :: . .. ::. . :::. .. ::.: .:.: : . : CCDS84 MARMGLAGAAGRWWGL---ALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANP- 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 MEVTHVSQLTWAR--HGESGSMAVFHQTQGPSY--SESKRLEFVAARLGAELRNASLRMF . ....:.:: . .: . ..:... ..: : .:.:: : . ....:. CCDS84 LPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEF----LRPSFTDGTIRLS 60 70 80 90 100 110 120 130 140 150 160 pF1KE4 GLRVEDEGNYTCLFVTFPQGSRSVDIWLRVLAKPQNTAEVQKVQLTG-----EPVPMARC :..:::: : : :.::: :.: .. : :.::: : : .. : . . : .: : CCDS84 RLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATC 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE4 VSTGGRPPAQITWHSDLGGMPNTSQVPGFLSGTVTVTSLWILVPSSQVDGKNVTCKVEHE .:..:.::. ..:.. : : . ... . .::::: : . :::: .. ....: :... CCDS84 TSANGKPPSVVSWETRLKGEAEYQEIRNP-NGTVTVISRYRLVPSREAHQQSLACIVNYH 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE4 SFEKPQLLTVNLTVYYPPEVSISGYDNNWYLGQNEATLTCDARSNPEPTGYNWSTTMGPL . . ::.: : : :::.: :.:.:::: . .. ::: : .:: : :.:.: : : CCDS84 MDRFKESLTLN--VQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSL 240 250 260 270 280 290 300 310 320 330 340 pF1KE4 PPFAVAQGAQLLIR-PVDKPINTTLICNVTNALGARQAELTVQVKEGPPSEHSGMSRNAI : . ::. :... :.. . : ::..:: .:.:.... :.. CCDS84 PKGVEAQNRTLFFKGPINYSLAGTYICEATNPIGTRSGQVEVNITAFCQLIYPGKGRTRA 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE4 IFLVLGILVFLILLGIGIYFYWSKCSREVLWHCHLCPSSTEHASASANGHVSYSAVSREN CCDS84 RMF 350 >>CCDS58843.1 NECTIN3 gene_id:25945|Hs108|chr3 (487 aa) initn: 312 init1: 221 opt: 546 Z-score: 508.4 bits: 103.3 E(32554): 5.4e-22 Smith-Waterman score: 546; 30.0% identity (61.4% similar) in 347 aa overlap (22-361:30-365) 10 20 30 40 50 pF1KE4 MARAMAAAWPLLLVALLVLSWPPPGTGDVVVQAPTQVPGFLGDSVTLPCYLQ : .: ..:. : .: . : .:.: : .. CCDS58 MAEGWRWCFVRRTPGLLRGPLLPRSFSGNPRALAGPIIVE-P-HVTAVWGKNVSLKCLIE 10 20 30 40 50 60 70 80 90 100 pF1KE4 VPNMEVTHVSQLTWAR-HGESGSMAVFHQTQGPSYSESKRLEFVAARL--GAELRNASLR : : .: :..: . ::.:.. .. :. :.:. : . :. . : . : .:.. CCDS58 V-NETIT---QISWEKIHGKSSQTVAVHH---PQYGFSVQGEYQGRVLFKNYSLNDATIT 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE4 MFGLRVEDEGNYTCLFVTFPQGSRSVDIWLRVLAKPQNTAEVQKVQLT--GEPVPMARCV . .. : :.: : :::: :. . . . ::..: . .: :. . : :. CCDS58 LHNIGFSDSGKYICKAVTFPLGNAQSSTTVTVLVEPTVSLIKGPDSLIDGGNETVAAICI 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE4 STGGRPPAQITWHSDLGGMPNTSQVPGFLSGTVTVTSLWILVPSSQVDGKNVTCKVEHES .. :.: :.: :..::: : .:. .: . :.:. : . : :. . :. .:: :.: . CCDS58 AATGKPVAHIDWEGDLGEMESTTT--SFPNETATIISQYKLFPTRFARGRRITCVVKHPA 180 190 200 210 220 230 240 250 260 270 280 pF1KE4 FEKPQLLTVNLTVYYPPEVSISGYDNNWYLGQNEATLTCDARSNPEPTGYNWSTTMGPLP .:: . : . : ::::..:::.::..:.. ..: :.: .:: : :: : : CCDS58 LEKDIRYSFILDIQYAPEVSVTGYDGNWFVGRKGVNLKCNADANPPPFKSVWSRLDGQWP 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE4 PFAVAQGAQL-LIRPVDKPINTTLICNVTNALGARQAELTVQVKEGPPSEHSGMS-RNAI .:. : ...:. . . ::.:::.:: :. . .. ... : .. :... .:. CCDS58 DGLLASDNTLHFVHPLTFNYSGVYICKVTNSLGQRSDQKVIYISDVPFKQTSSIAVAGAV 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE4 IFLVLGILVFLILLGIGIYFYWSKCSREVLWHCHLCPSSTEHASASANGHVSYSAVSREN : ::..... :.. . CCDS58 IGAVLALFIIAIFVTVLLTPRKKRPSYLDKVIDLPPTHKPPPLYEERSPPLPQKDLFQPE 350 360 370 380 390 400 417 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 17:18:22 2016 done: Mon Nov 7 17:18:23 2016 Total Scan time: 2.730 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]